JP2001154684A - Speech speed converter - Google Patents

Speech speed converter

Info

Publication number
JP2001154684A
JP2001154684A JP33315599A JP33315599A JP2001154684A JP 2001154684 A JP2001154684 A JP 2001154684A JP 33315599 A JP33315599 A JP 33315599A JP 33315599 A JP33315599 A JP 33315599A JP 2001154684 A JP2001154684 A JP 2001154684A
Authority
JP
Japan
Prior art keywords
speech speed
speech
speed
audio signal
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP33315599A
Other languages
Japanese (ja)
Inventor
Kotaro Machidera
侯大郎 待寺
Chikako Ohara
千賀子 大原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Anritsu Corp
Original Assignee
Anritsu Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Anritsu Corp filed Critical Anritsu Corp
Priority to JP33315599A priority Critical patent/JP2001154684A/en
Publication of JP2001154684A publication Critical patent/JP2001154684A/en
Withdrawn legal-status Critical Current

Links

Abstract

PROBLEM TO BE SOLVED: To gradually change the speech speed of the beginning of the speech to a target speech speed in a speech speed converter. SOLUTION: The converter analyzes inputted digital voice signals, synthesizes the analyzed digital voice signals, generates new voice signals having a specified speech speed, converts the new voice signals into analog voice signals and outputs the signals to the external. The converter is provided with a sound detecting means 13 which detects a first sound in the inputted voice signals and a speech speed computing section 14 which changes a normal speech speed to a faster target speech speed within a prescribed time interval starting from the sound detecting time of the means 13, successively computes a speech speed to maintain the target speech speed and transmits the speech to a signal synthesis section.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、音声の話速を変更
する話速変換装置に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a speech speed conversion device for changing the speech speed of voice.

【0002】[0002]

【従来の技術】例えば外国語を学習する方法として、実
際にその外国語を耳で聞いて学習する学習法が効果的で
ある。この場合、同じ会話を繰り返し聴くことが重要で
ある。したがって、外国語を聴く能力を向上させるため
に、簡便な方法として、例えば、数分〜十数分の会話又
は朗読を録音したテープを再生して学習する。
2. Description of the Related Art For example, as a method of learning a foreign language, a learning method of actually learning by listening to the foreign language by ear is effective. In this case, it is important to listen to the same conversation repeatedly. Therefore, in order to improve the ability to listen to a foreign language, as a simple method, for example, learning is performed by playing a tape on which a conversation or reading for several minutes to several tens of minutes is recorded.

【0003】この場合、語学学習専用のテープレコーダ
においては、音声の再生速度を一定の範囲で可変できる
ように構成されている。したがって、初級学習者は再生
速度を遅くして録音された会話をゆっくり聴き、上級学
習者は再生速度を速くして録音された会話を速く聴くこ
とによって学習効率を向上させることができる。
[0003] In this case, a tape recorder dedicated to language learning is configured so that the sound reproduction speed can be varied within a certain range. Therefore, the beginner learner can listen to the recorded conversation at a slower playback speed, and the advanced learner can improve the learning efficiency by listening to the recorded conversation at a faster playback speed.

【0004】しかし、ただ単に音声の再生速度を変更さ
せたのみでは、再生される音声の周波数が変化してしま
い、音声が不自然に聞こえる。
However, simply changing the reproduction speed of the sound changes the frequency of the reproduced sound, and the sound sounds unnatural.

【0005】このような不都合を解消するために、話す
速度、すなわち話速を変化させたとしても、音声の周波
数は変化せず、ただ話し方がゆっくりになったり、早口
になるのみで自然に聞こえる話速変換手法が提唱されて
いる。次に、この話速変換手法を図13及び図14を用
いて説明する。
[0005] Even if the speaking speed, that is, the speaking speed is changed in order to solve such inconvenience, the frequency of the voice does not change, and the sound is heard naturally only by slowing down the speech or making the speaker speak faster. A speech speed conversion method has been proposed. Next, this speech speed conversion method will be described with reference to FIGS.

【0006】図13は、例えば「 It's difficult for
me to finish… 」と話した場合の音声信号1の波形
図である。図14はこの音声信号1の拡大図である。周
知のように、音声には子音と母音とがあり、音声信号1
にもそれに対応した子音と母音とがある。図示するよう
に子音は1個の無声音2で構成され、母音は複数の有声
音3で構成されている。また、音声信号1には音声の途
切れたときの無音4が存在する。
FIG. 13 shows, for example, "It's difficult for
It is a waveform diagram of the audio signal 1 when saying "me to finish ...". FIG. 14 is an enlarged view of the audio signal 1. As is well known, speech includes consonants and vowels, and audio signal 1
Also have corresponding consonants and vowels. As shown, the consonant is composed of one unvoiced sound 2 and the vowel is composed of a plurality of voiced sounds 3. The audio signal 1 includes silence 4 when the audio is interrupted.

【0007】子音を構成する無声音2は比較的高い周波
数成分を有し、母音を構成する複数の有声音3はほぼ同
一波形を有する。したがって、話速を速くするために
は、母音を構成する複数の有声音3のうちの1個又は複
数の有声音3を間引いて、間引いた有声音3の前後の有
声音3どうし、又は無声音2と有声音3、又は有声音3
と無音4とを接続する。よって、母音の継続時間を短縮
でき、結果として音声信号1の全体の時間を短くでき、
音声の周波数や音質を変更することなく話速を速くでき
る。
[0007] The unvoiced sound 2 constituting a consonant has a relatively high frequency component, and the plurality of voiced sounds 3 constituting a vowel have substantially the same waveform. Therefore, in order to increase the speech speed, one or a plurality of voiced sounds 3 among the plurality of voiced sounds 3 constituting the vowel are thinned out, and the voiced sounds 3 before and after the thinned voiced sound 3 or unvoiced sounds 3 are mixed. 2 and voiced sound 3 or voiced sound 3
And silence 4 are connected. Therefore, the duration of the vowel can be shortened, and as a result, the entire time of the audio signal 1 can be shortened,
Speaking speed can be increased without changing the frequency or sound quality of the voice.

【0008】逆に、話速を遅くする場合は、母音を構成
する複数の有声音3に対して同一の有声音3を挿入して
母音の継続時間を長くすればよい。
Conversely, when the speech speed is to be reduced, the same voiced sound 3 may be inserted into a plurality of voiced sounds 3 constituting a vowel to extend the duration of the vowel.

【0009】この話速変換を自動的に行うためには、音
声信号1に含まれる無声音2と有声音3と無音4とを区
分けする必要がある。この区分手法として、母音は複数
の有声音3が継続する性質を利用して、音声信号1に対
して自己相関関数を算出することにより、無声音2と有
声音3との区分け、及び各有声音3の継続時間(ピッ
チ)が検出する。
In order to automatically perform the speech speed conversion, it is necessary to classify the unvoiced sound 2, the voiced sound 3 and the silent sound 4 included in the voice signal 1. As a classification method, a vowel uses the property that a plurality of voiced sounds 3 continue, and calculates an autocorrelation function for the audio signal 1, thereby classifying the unvoiced sound 2 and the voiced sound 3 and each voiced sound. The duration (pitch) of 3 is detected.

【0010】そして、母音を構成する複数の有声音3の
うち何個の有声音3を間引くか、又は何個の有声音3を
挿入するかで、音声信号1の話速が定まる。
[0010] The speech speed of the voice signal 1 is determined by how many voiced sounds 3 among a plurality of voiced sounds 3 constituting a vowel are thinned out or how many voiced sounds 3 are inserted.

【0011】したがって、このような話速変換機能が組
込まれた音声再生装置を用いることにより、語学学習者
は、違和感なく、速い速度又は遅い速度で会話やナレー
ションを聴くことができる。
[0011] Therefore, by using a voice reproducing apparatus incorporating such a speech speed conversion function, a language learner can listen to conversation or narration at a high speed or a low speed without a sense of incongruity.

【0012】[0012]

【発明が解決しようとする課題】しかしながら、上述し
た話速変換機能が組込まれた音声再生装置においても、
まだ改良すべき次のような課題があった。
However, even in a sound reproducing apparatus incorporating the above-mentioned speech speed conversion function,
There were the following issues that still need to be improved.

【0013】すなわち、上述した話速変換機能が組込ま
れた音声再生装置においては、音声を再生開始してから
再生終了まで、同一の速度である。したがって、たとえ
上級学習者にとっても、再生開始直後からいきなり早口
で再生されたとしても、その早口に慣れるまで時間を要
し、会話又はナレーションの冒頭部分が正確に聞取れな
い問題があった。
That is, in the audio reproducing apparatus in which the above-mentioned speech speed conversion function is incorporated, the speed is the same from the start of the reproduction of the sound to the end of the reproduction. Therefore, even for advanced learners, even if the content is played back immediately after the start of playback, it takes time to get used to the playback, and there is a problem that the beginning of a conversation or narration cannot be heard accurately.

【0014】本発明はこのような事情に鑑みてなされた
ものであり、話し始めは通常の速度であり、その後、次
第に速くしていくことにより、たとえ話し速度を速く設
定したとしても、会話又はナレーションの冒頭部分も正
確に聞き分けることができ、語学学習者にとって、使い
勝手の良い話速変換装置を提供することを目的とする。
[0014] The present invention has been made in view of such circumstances, and the speech speed is normal at the beginning, and then gradually increased, so that even if the speech speed is set to be high, the conversation or An object of the present invention is to provide a speech speed conversion device that can accurately recognize the beginning of a narration and that is easy for a language learner to use.

【0015】[0015]

【課題を解決するための手段】上記課題を解消するため
に、本発明は、入力されたデジタルの音声信号を記憶す
る音声信号メモリと、この音声信号メモリから出力され
たデジタルの音声信号を解析する音声解析部と、この音
声解析部で解析されたデジタルの音声信号を合成して指
定された話速を有する新たな音声信号として出力する信
号合成部とを備えた話速変換装置に適用される。
In order to solve the above-mentioned problems, the present invention provides an audio signal memory for storing an input digital audio signal, and a digital audio signal output from the audio signal memory. The present invention is applied to a speech speed conversion device comprising a voice analysis unit for performing the above-described processing, and a signal synthesis unit for synthesizing the digital voice signal analyzed by the voice analysis unit and outputting as a new voice signal having a specified voice speed. You.

【0016】そして、上記課題を解消するために、本発
明においては、入力された音声信号における最初の有音
を検出する有音検出手段と、この有音検出手段の有声音
検出時刻から規定時間経過するまでの期間内に、時間経
過に伴って通常話速より速い目標話速まで変化させ、か
つ規定時間経過後に、目標話速を維持する話速を順次算
出して信号合成部へ送出する話速算出部とを備えたもの
である。
In order to solve the above-mentioned problem, the present invention provides a sound detecting means for detecting the first sound in an input audio signal, and a specified time from a voice sound detecting time of the sound detecting means. Within the period until the elapsed time, the speech speed is changed to the target speech speed higher than the normal speech speed with the passage of time, and after the lapse of the specified time, the speech speed for maintaining the target speech speed is sequentially calculated and transmitted to the signal synthesis unit. And a speech speed calculation unit.

【0017】このように構成された話速変換装置におい
ては、入力された音声信号は音声信号メモリへ一旦格納
された後、読出されて信号合成部で指定された話速を有
する新たな音声信号に合成される。そして、この信号合
成部に印加される話速が、音声信号における最初の有音
の検出時刻から規定時間経過するまでの期間、時間経過
に伴って通常話速より速い目標話速まで増加し、その後
目標話速を維持するように制御される。
In the thus constructed speech speed conversion device, the input speech signal is temporarily stored in the speech signal memory, read out, and then read into a new speech signal having the speech speed designated by the signal synthesis unit. Is synthesized. Then, the speech speed applied to the signal synthesizing unit is increased from the detection time of the first sound in the audio signal to the target speech speed higher than the normal speech speed with the lapse of time from the detection time of the first sound to the specified time, Thereafter, control is performed so as to maintain the target speech speed.

【0018】したがって、この話速変換装置が組込まれ
た再生装置においては、会話やナレーションの冒頭部分
のみ通常話速でその後は通常話速より速い目標話速の早
口となる。よって、語学学習者が会話やナレーションの
冒頭部分を聞き逃すことはない。
Therefore, in the reproducing apparatus in which the speech speed conversion device is incorporated, only the beginning portion of the conversation or the narration becomes the normal speech speed, and thereafter the target speech speed becomes faster than the normal speech speed. Thus, language learners do not miss the beginning of a conversation or narration.

【0019】また、別の発明は、入力されたデジタルの
音声信号を記憶する音声信号メモリと、この音声信号メ
モリから出力されたデジタルの音声信号を無声音と有声
音と無音とに区分けする音声解析部と、この音声解析部
で区分けされた有声音のみを指定された話速に対応して
間引き、無声音と間引かれた後の有声音と無音とを接続
して新たな音声信号を合成する信号合成部とを備えた話
速変換装置に適用される。
Further, another invention relates to an audio signal memory for storing an input digital audio signal, and an audio analysis for dividing the digital audio signal output from the audio signal memory into unvoiced sound, voiced sound, and silent sound. Unit and only the voiced sound segmented by the speech analysis unit are decimated in accordance with the specified speech speed, and the unvoiced sound and the decimated voiced sound and silence are connected to synthesize a new speech signal. The present invention is applied to a speech speed conversion device including a signal synthesis unit.

【0020】そして、上記課題を解決するために、本発
明においては、入力された音声信号の開始時刻から規定
時間経過するまでの期間内に、時間経過に伴って通常話
速より速い目標話速まで変化させ、かつ規定時間経過
後、目標話速を維持する話速を順次算出して信号合成部
へ送出する話速算出部を備えている。
In order to solve the above-mentioned problem, according to the present invention, a target speech speed higher than a normal speech speed with a lapse of time within a period from a start time of an input audio signal to a lapse of a specified time. And a speech speed calculation unit for sequentially calculating a speech speed for maintaining a target speech speed after a lapse of a specified time and sending the calculated speech speed to a signal synthesis unit.

【0021】このように構成された話速変換装置におい
ては、入力された音声信号は、音声信号メモリに一旦記
憶された後、音声解析部で前述した無声音と有声音と無
音とに区分される。そして、次の信号合成部で、指定さ
れた通常話速より速い話速に対応した数の有声音が間引
かれて指定された話速の新たな音声信号となる。
In the thus constructed speech speed converter, the input speech signal is temporarily stored in the speech signal memory and then divided by the speech analysis unit into the above-mentioned unvoiced sound, voiced sound and silence. . Then, in the next signal synthesizing unit, the number of voiced sounds corresponding to the speech speed higher than the designated normal speech speed is thinned out to become a new voice signal of the designated speech speed.

【0022】そして、この信号合成部へ供給する話速
は、話速算出部において、入力された音声信号の開始時
刻から規定時間経過するまでの期間、時間経過に伴って
通常話速より速い目標話速まで増加し、その後目標話速
を維持するように制御される。
The speech speed to be supplied to the signal synthesizing unit is, in the speech speed calculating unit, a period from the start time of the input voice signal to a lapse of a predetermined time, and a target speed higher than the normal speech speed with time. It is controlled to increase to the speech speed and then maintain the target speech speed.

【0023】したがって、上述した発明とほぼ同様の効
果を奏することが可能である。
Therefore, it is possible to obtain substantially the same effect as the above-described invention.

【0024】又、別の発明においては、上述した話速変
換装置において、入力された音声信号の開始時刻は、こ
の音声信号における音声解析部で区分された先頭の有声
音の開始時刻としている。
According to another aspect of the present invention, in the above-described speech speed conversion device, the start time of the input voice signal is the start time of the first voiced sound of the voice signal which is divided by the voice analysis unit.

【0025】前述したように、音声信号は子音に対応す
る無声音と母音に対応する有声音とがある。「シーッ」
や「チーッ」等の無声音はあまり意味をなさず、有声音
が意味をなす場合が多い。したがって、有声音の開始時
刻から話速の変化を開始するのが望ましい。
As described above, voice signals include unvoiced sounds corresponding to consonants and voiced sounds corresponding to vowels. "Shhh"
Unvoiced sounds such as "chic" and "chee" do not make much sense, and voiced sounds often make sense. Therefore, it is desirable to start changing the speech speed from the start time of the voiced sound.

【0026】さらに別の発明においては、上述した話速
変換装置における話速倍率算出部は、音声解析部が音声
信号における各無音におけ無音開始時刻から該当無音の
継続期間を計時する無音継続期間計時手段と、無音継続
期間計時手段がしきい値時間を計時する毎に、計時回数
に応じて増加する話速を算出する話速不連続算出手段と
を備えている。
In another aspect of the present invention, the speech rate multiplying unit in the speech rate converting apparatus described above is characterized in that the speech analyzing unit measures a duration of the silence from a silence start time for each silence in the speech signal. A timer is provided, and a speech speed discontinuity calculator is configured to calculate a speech speed that increases in accordance with the number of times each time the silent duration measuring unit measures the threshold time.

【0027】このように構成された話速変換装置におい
ては、会話やナレーションの途中に存在するしきい値以
上の無音期間が発生する毎に、話速が増加する。したが
って、一つの単語や一つの文章の途中で話速が変化する
ことが防止され、より自然な言葉として聴くことができ
る。
In the thus constructed speech speed conversion device, the speech speed increases each time a silent period equal to or greater than a threshold value occurs during conversation or narration. Therefore, it is possible to prevent the speech speed from being changed in the middle of one word or one sentence, and to listen as a more natural word.

【0028】さらに別の発明は、上述した話速変換装置
において、音声解析部が音声信号における各無音におけ
無音開始時刻から該当無音の継続期間を計時する無音継
続期間計時手段と、この無音継続期間計時手段がしきい
値時間を計時する毎に、該当無音の次に来る無声音又は
有声音の開始時刻から時間経過に伴って通常話速より速
い目標話速まで変化させ、その後目標話速を維持する話
速を順次算出して信号合成部へ送出する話速算出部とを
備えている。
According to still another aspect of the present invention, there is provided the above-mentioned speech speed conversion apparatus, wherein the voice analysis unit measures the duration of the corresponding silence from the silence start time at each silence in the voice signal; Every time the period timer counts the threshold time, it changes from the start time of the unvoiced sound or voiced sound that follows the corresponding silence to a target voice speed higher than the normal voice speed with the passage of time, and thereafter the target voice speed is changed. A speech speed calculating unit for sequentially calculating the maintained speech speed and sending it to the signal combining unit.

【0029】このように構成された、話速変換装置にお
いては、会話やナレーションの途中に存在するしきい値
以上の無音期間が発生する毎に、話速が通常話速から通
常の話速より速い目標話速まで変化する。
In the thus constructed speech speed converter, the speech speed is changed from the normal speech speed to the normal speech speed every time a silent period equal to or greater than a threshold value occurs during a conversation or narration. It changes to a fast target speech speed.

【0030】[0030]

【発明の実施の形態】以下、本発明の各実施形態を図面
を用いて説明する。 (第1実施形態)図1は本発明の第1実施形態に係る話
速変換装置の概略構成を示すブロック図である。入力端
子5に対して図13に示した音声信号1と同一構成の一
連の音声信号aが入力される。したがって、この音声信
号aは、図14に示すように、子音に対応する無声音2
と、母音に対応する有声音3と、無音4とで構成されて
いる。そして、この実施形態の話速変換装置において
は、無声音2又は有声音3の継続期間を有音期間16と
定義し、無音4の継続期間を無音期間17と定義する。
Embodiments of the present invention will be described below with reference to the drawings. (First Embodiment) FIG. 1 is a block diagram showing a schematic configuration of a speech speed conversion device according to a first embodiment of the present invention. A series of audio signals a having the same configuration as the audio signal 1 shown in FIG. Therefore, as shown in FIG. 14, this audio signal a is a voiceless sound 2 corresponding to a consonant.
And a voiced sound 3 corresponding to a vowel and a silence 4. Then, in the speech speed conversion device of this embodiment, the duration of the unvoiced sound 2 or the voiced sound 3 is defined as a voiced period 16, and the duration of the silence 4 is defined as a silent period 17.

【0031】入力端子5から入力されたアナログの音声
信号aは、A/D変換器5でデジタルの音声信号に変換
された後、音声信号メモリ7に蓄積される。音声解析部
8は、この音声信号メモリ8に書込まれた一連のデジタ
ルの音声信号a1を無声音2と、有声音3と、無音4と
に区分けする。具体的には、音声信号a1の信吾レベル
を調べて、有音期間16と無音期間17とを区分けす
る。その後、各有音期間16の信号に対して自己相関解
析を実施して、この有音期間16を無声音2と有声音3
とに区分けする。
The analog audio signal a input from the input terminal 5 is converted into a digital audio signal by the A / D converter 5 and then stored in the audio signal memory 7. The audio analysis unit 8 divides the series of digital audio signals a 1 written in the audio signal memory 8 into unvoiced sounds 2, voiced sounds 3, and silent sounds 4. Specifically, the speech level of the audio signal a 1 is checked, and the sound period 16 and the silence period 17 are classified. After that, the autocorrelation analysis is performed on the signal of each voiced period 16 to determine the voiced period 16 as unvoiced sound 2 and voiced sound 3.
And is divided into

【0032】音声解析部8で、無声音2と有声音3と無
音4とに区分けされた音声信号a2は信号合成部9へ入
力される。信号合成部9は、入力された音声信号a2
おける各母音を構成する複数の有声音3のうち、話速算
出部14にで指定された話速としての話速倍率Yに対応
した数だけ間引く。そして、入力された音声信号a2
おける無声音2と間引き後の有声音3と無音4とを接続
して新たな音声信号a 3を合成して出力する。ここで、
話速倍率Yとは、速度変更を実施していない通常の話速
を1(基準)とした場合の倍率である。
In the voice analysis unit 8, the unvoiced sound 2, the voiced sound 3 and the
Sound signal a divided into sound 4TwoEnters the signal synthesizer 9
Is forced. The signal synthesizing unit 9 receives the input audio signal aTwoTo
Speed calculation of voiced sounds 3 that make up each vowel
Corresponds to the speech speed magnification Y as the speech speed specified in the output unit 14
Decimate by the number you chose. Then, the input audio signal aTwoTo
The unvoiced sound 2 and the decimated voiced sound 3 and silence 4
And a new audio signal a ThreeAnd output. here,
The speech speed magnification Y is a normal speech speed without changing the speed.
Is 1 (reference).

【0033】信号合成部9から出力された新たな音声信
号a3は出力バッファ10に一旦格納した後、D/A変
換11でアナログの音声信号a4に変換されて、出力端
子13から出力される。したがって、出力端子12から
出力された新たなアナログの音声信号a4は、入力端子
5に入力されたアナログの音声信号aに対して、指定さ
れた話速倍率Yにする分だけ短くなり、その分、再生さ
れた会話又はナレーションの速度が速くなる。
The new audio signal a 3 output from the signal synthesizing unit 9 is temporarily stored in an output buffer 10, converted into an analog audio signal a 4 by a D / A converter 11, and output from an output terminal 13. You. Therefore, the new analog audio signal a 4 output from the output terminal 12 is shorter than the analog audio signal a input to the input terminal 5 by the specified speech speed magnification Y, and Minutes, the speed of the replayed conversation or narration is increased.

【0034】音声信号メモリ7から出力されたデジタル
の音声信号a1は、音声解析部8へ入力されると共に、
有音検出部13へ入力される。有音検出部13は、入力
された音声信号a1における最初の音声信号a1の信吾レ
ベルを調べて、有音期間16の先頭を有音検出として話
速算出部14へ通知する。
The digital audio signal a 1 output from the audio signal memory 7 is input to the audio analyzer 8 and
It is input to the sound detection unit 13. The sound detection unit 13 checks the signal level of the first audio signal a 1 in the input audio signal a 1 , and notifies the speech speed calculation unit 14 of the beginning of the sound period 16 as sound detection.

【0035】話速算出部14には、時間設定部18から
規定時間TBが設定されると共に、目標話速設定部19
から目標話速としての目標話速倍率Aが設定される。
[0035] The speech speed calculation part 14, with the specified time T B from the time setting unit 18 is set, the target speech speed setting unit 19
, The target speech speed magnification A as the target speech speed is set.

【0036】次に、話速算出部14における話速倍率Y
の算出処理動作を説明する。この話速算出部14は、図
3に示すように、デジタルの音声信号a2の有音検出時
刻tSから規定時間TB経過時刻tEまでの期間内に、話
速倍率Yを通常話速に対応する通常話速倍率(Y=1)
から通常話速より速い目標話速倍率Aへ変化させる処理
を実施する。
Next, the speech speed magnification Y in the speech speed calculation unit 14
Will be described. The speech rate calculation unit 14, as shown in FIG. 3, within the period from sound detection time t S of the digital audio signal a 2 to the specified time T B has elapsed time t E, usually talking speech speed ratio Y Normal speech speed magnification corresponding to speed (Y = 1)
From the target voice speed magnification A higher than the normal voice speed.

【0037】具体的には、図2に示す処理を実施する。
図2において、有音検出部13が有音を検出すると(R
1)、経過時間Tを初期化(T=0)する(R2)。そ
して、微小時間Δtが経過すると(R3)、R4にて経
過時間Tを更新する(T=T+Δt)。そして、更新後
の経過時間Tが規定時間TB未満の場合(R5)、下式
に示す話速倍率Yの算出を行う(R6)。 Y=[(A―1)/TB]T+1 算出した話速倍率Yを信号合成部9へ送出する(R
7)。そして、R3へ戻り、次の微小時間Δtの経過を
待つ。
Specifically, the processing shown in FIG. 2 is performed.
In FIG. 2, when the sound detection unit 13 detects a sound (R
1) The elapsed time T is initialized (T = 0) (R2). When the short time Δt has elapsed (R3), the elapsed time T is updated at R4 (T = T + Δt). When the elapsed time T after the update is less than the predetermined time T B (R5), and calculates the speech speed ratio Y shown in the following formula (R6). Y = [(A-1) / T B ] T + 1 The calculated speech speed magnification Y is transmitted to the signal synthesizing unit 9 (R
7). Then, the process returns to R3 and waits for the elapse of the next minute time Δt.

【0038】R5にて、更新後の経過時間Tが規定時間
Bに達すると、目標話速倍率Y=Aを信号合成部9へ
送出する。
[0038] At R5, the elapsed time T after the update reaches the predetermined time T B, and sends the target speech speed ratio Y = A to the signal synthesizing unit 9.

【0039】このように構成された話速変換装置におい
ては、図3に示すように、時刻t0で音声信号aが入力
開始されると、出力端子12から出力される音声信号a
4の話速は通常話速(Y=1)である。そして、時刻tS
にて、有音期間16が開始され、有音が検出されると、
経過時間Tの計時が開始され、話速倍率Yが増加を開始
する。
In the speech speed conversion device thus configured, as shown in FIG. 3, when the input of the audio signal a is started at time t 0 , the audio signal a output from the output terminal 12 is output.
The voice speed of 4 is the normal voice speed (Y = 1). Then, the time t S
At, the sound period 16 starts, and when sound is detected,
Timing of the elapsed time T is started, and the speech speed magnification Y starts increasing.

【0040】そして、時刻tSから経過時間Tが規定時
間TBを経過した時刻tEにて、話速倍率Yが目標話速倍
率Aに達する(Y=A)。規定時間TBを経過した時刻
E以降は、話速倍率Yは目標話速倍率Aを維持する。
[0040] Then, at time t E the elapsed time T has exceeded the specified time T B from the time t S, speech speed ratio Y reaches the target speech speed ratio A (Y = A). Time t E after a lapse of specified time T B is speaking rate ratio Y maintains the target speech speed ratio A.

【0041】したがって、この話速変換装置を用いるこ
とによって、会話やナレーションの冒頭部分のみ通常話
速でその後は目標話速の早口となる。よって、語学学習
者が会話やナレーションの冒頭部分を聞き逃すことはな
い。
Therefore, by using this speech speed conversion device, only the beginning portion of the conversation or narration becomes the normal speech speed, and thereafter the target speech speed becomes faster. Thus, language learners do not miss the beginning of a conversation or narration.

【0042】(第2実施形態)図4は本発明の第2実施
形態に係る話速変換装置の概略構成を示すブロック図で
ある。図1に示す第1実施形態の話速変換装置と同一部
分には同一符号を付して重複する部分の詳細説明を省略
する。
(Second Embodiment) FIG. 4 is a block diagram showing a schematic configuration of a speech speed conversion device according to a second embodiment of the present invention. The same portions as those of the speech speed conversion device of the first embodiment shown in FIG. 1 are denoted by the same reference numerals, and detailed description of the overlapping portions will be omitted.

【0043】この話速変換装置においては、音声解析部
8で、無声音2と有声音3と無音4とに区分けされた音
声信号a2は信号合成部9及び話速算出部14aへ入力
される。信号合成部9は、入力された音声信号a2にお
ける各母音を構成する複数の有声音3のうち、話速設定
部14aにで指定された話速倍率Yに対応した数だけ間
引く。そして、入力された音声信号a2における無声音
2と間引き後の有声音3と無音4とを接続して新たな音
声信号a3を合成して出力する。
In this speech speed conversion device, the speech signal a 2 divided into the unvoiced sound 2, the voiced sound 3 and the silence 4 by the speech analysis unit 8 is input to the signal synthesis unit 9 and the speech speed calculation unit 14a. . Signal combining unit 9, among the plurality of voiced 3 constituting each vowel in the speech signal a 2 input, thins out the number corresponding to the designated speech rate ratio Y in the speech speed setting unit 14a. Then, the unvoiced sound 2 in the input audio signal a 2 and the voiced sound 3 and the silence 4 after the thinning are connected to synthesize a new audio signal a 3 and output it.

【0044】したがって、出力端子12から出力された
新たなアナログの音声信号a4の話速は、入力端子1に
入力されたアナログの音声信号aに対して、話速設定部
14aにで指定された話速倍率Yの話速となる。
Therefore, the speech speed of the new analog voice signal a 4 output from the output terminal 12 is specified by the voice speed setting unit 14 a with respect to the analog voice signal a input to the input terminal 1. It becomes the speaking speed of the speaking speed magnification Y.

【0045】話速算出部14aには、ステップ数設定部
20からステップ数Mが入力されると共に、目標話速設
定部19から目標話速倍率Aが入力される。ステップ数
Mは、話速倍率Yを通常話速(Y=1)から何ステップ
で目標話速倍率Aまで移行させるかのステップ数であ
る。
The speech speed calculation unit 14a receives the number of steps M from the step number setting unit 20 and the target speech speed magnification A from the target speech speed setting unit 19. The number of steps M is the number of steps at which the voice speed Y is shifted from the normal voice speed (Y = 1) to the target voice speed A.

【0046】次に、話速算出部14aにおける話速倍率
Yの算出処理動作を説明する。この話速算出部14a
は、図6に示すように、音声信号a2の入力時刻tSから
規定時間TB経過までの期間内に、話速倍率Yを通常話
速(Y=1)から通常話速より速い目標話速倍率AへM
ステップで変化させる処理を実施する。
Next, the operation of calculating the speech speed magnification Y in the speech speed calculator 14a will be described. This speech speed calculator 14a
As shown in FIG. 6, in the period until the specified time T B has elapsed from the input time t S of the audio signal a 2, faster target than normal speaking speed the speech speed ratio Y from the normal speech speed (Y = 1) M to speech speed magnification A
Perform the process of changing in steps.

【0047】具体的には、図5に示す処理を実施する。
図5において、図6における話速倍率Yのステップ数I
を初期値0に設定し(I=0)、図7における音声信号
2の無音期間17の継続時間Tがしきい値時間TSを超
えたことを示す時間経過フラグFを初期値0に設定(F
=0)する(S1)。
Specifically, the processing shown in FIG. 5 is performed.
In FIG. 5, the number of steps I of the speech speed magnification Y in FIG.
Is set to an initial value 0 (I = 0), and a time lapse flag F indicating that the duration T of the silent period 17 of the audio signal a 2 in FIG. 7 exceeds the threshold time T S is set to the initial value 0. Setting (F
= 0) (S1).

【0048】微小時間Δtが経過すると(S2)、その
時点における音声信号a2の解析結果を読取る(S
3)。そして、解析結果が無音期間17の場合(S
4)、S5にて、無音期間17の継続時間T1を更新す
る(T1=T1+Δt)。
When the minute time Δt has elapsed (S2), the analysis result of the audio signal a 2 at that time is read (S2).
3). When the analysis result is the silent period 17 (S
4) In S5, the duration T 1 of the silent period 17 is updated (T 1 = T 1 + Δt).

【0049】更新後の継続時間T! がしきい値時間TS
を経過していない場合は(S6)、S2へ戻り、微小時
間Δtの経過を待つ。更新後の継続時間T1がしきい値
時間TSを経過した場合は(S6)、無音期間17の継
続時間T1を0にクリアし(S7)、時間経過フラグF
が0のままである場合(S8)、この無音期間17で初
めて継続時間T1がしきい値時間TSを経過したので、こ
の時間経過フラグFを1に設定する(S9)。そして、
S10にて、ステップ数Iを更新する(I=I+1)。
The updated duration T ! Is equal to the threshold time T S
Does not elapse (S6), the process returns to S2, and waits for the elapse of the minute time Δt. If the updated duration T 1 has exceeded the threshold time T S (S6), the duration T 1 of the silence period 17 is cleared to 0 (S7), and the time elapsed flag F
Remains at 0 (S8), the duration T 1 has exceeded the threshold time T S for the first time in the silence period 17, so the time lapse flag F is set to 1 (S9). And
In S10, the number of steps I is updated (I = I + 1).

【0050】そして、ステップ数Iが通常話速より速い
話速に対応する目標話速倍率Aに対応する最終ステップ
数Mを超えていないことを確認すると(S11)、次式
で、話速倍率Yを算出する(S12)。 Y=[(A―1)/M]I+1 算出した話速倍率Yを信号合成部9へ送出する(S1
3)。
Then, when it is confirmed that the number of steps I does not exceed the final number of steps M corresponding to the target speech speed magnification A corresponding to the speech speed higher than the normal speech speed (S11), the speech speed magnification is calculated by the following equation. Y is calculated (S12). Y = [(A-1) / M] I + 1 The calculated speech speed magnification Y is sent to the signal synthesizing unit 9 (S1).
3).

【0051】なお、S8にて、既に、時間経過フラグF
が1に設定されていた場合は、この無音期間17内で既
に話速倍率Yの算出処理(更新処理)が終了しているの
で、なにもせずにS2へ戻る。
At S8, the time lapse flag F has already been set.
Is set to 1, since the calculation (updating) of the speech speed magnification Y has already been completed within the silent period 17, the process returns to S2 without doing anything.

【0052】さらに、S4にて、無音期間17でなく、
有音期間16の場合、S14へ進み、無音期間17の継
続時間T1を0にクリアし、かつ時間超過フラグFをク
リアする。
Further, in S4, instead of the silent period 17,
In the case of the sound period 16, the process proceeds to S 14, where the duration T 1 of the silence period 17 is cleared to 0, and the time excess flag F is cleared.

【0053】さらに、S11にて、ステップ数Iが目標
話速倍率Aに対応する最終ステップ数Mを超えると、話
速は既に通常話速より速い目標話速倍率Aに達している
ので、なにもせずにS2へ戻る。
Further, if the number of steps I exceeds the final number of steps M corresponding to the target speech speed magnification A in S11, the speech speed has already reached the target speech speed magnification A higher than the normal speech speed. Return to S2 without any action.

【0054】このように構成された第2実施形態の話速
変換装置において、図7に示す信号波形を有した無声音
2と有声音3と無音4とに区分けされた音声信号a2
話速算出部14aへ入力された場合、時刻t2〜t3の区
間、時刻t4〜t6の区間、及び時刻t6〜t8の区間にお
いて、無音期間17が存在するが、2番目の時刻t2
3の区間の継続時間Tのみが、時刻t5にて、しきい値
時間TSを経過するので、この時刻t5にて、話速倍率Y
が話速が上昇する方向に、1ステップだけ更新される。
In the speech speed conversion device of the second embodiment thus configured, the speech signal a 2 divided into the unvoiced sound 2, the voiced sound 3 and the silence 4 having the signal waveform shown in FIG. If input to the calculation unit 14a, the time t 2 ~t 3 sections, the time t 4 ~t 6 intervals, and in the period from time t 6 ~t 8, although silent period 17 exists, the second time t 2 ~
only the duration T of t 3 of the section is, at time t 5, since passed the threshold time T S, at this time t 5, the speech speed magnification Y
Is updated by one step in the direction in which the speech speed increases.

【0055】したがって、図6に示すように、入力され
た音声信吾aにおいて、音声信号の入力開始時刻から、
しきい値時間TS以上の無音期間17が発生する毎に、
話速が目標話速倍率Aに達するまで変化される。そし
て、話速が目標話速倍率Aに速に達すると、それ以降
は、目標話速倍率Aを維持する。
Therefore, as shown in FIG. 6, in the input voice signal “a”, from the input start time of the voice signal,
Each time a silent period 17 longer than the threshold time T S occurs,
The speech speed is changed until the speech speed reaches the target speech speed magnification A. When the speech speed reaches the target speech speed magnification A, the target speech speed magnification A is maintained thereafter.

【0056】したがって、図1に示した第1実施形態の
話速変換装置と同様に、この第2実施形態の話速変換装
置を用いることによって、会話やナレーションの冒頭部
分のみ通常話速でその後は目標話速の早口となる。よっ
て、語学学習者が会話やナレーションの冒頭部分を聞き
逃すことはない。
Therefore, similarly to the speech speed conversion device of the first embodiment shown in FIG. 1, by using the speech speed conversion device of the second embodiment, only the beginning portion of conversation or narration is changed to the normal speech speed and thereafter Becomes the target speech speed. Thus, language learners do not miss the beginning of a conversation or narration.

【0057】さらに、この第2実施形態の話速変換装置
においては、会話やナレーションの途中に存在するしき
い値時間TS以上の無音期間17が発生する毎に、話速
倍率Yは、話速が増加する方向に変化される。したがっ
て、一つの単語や一つの文章の途中で話速が変化するこ
とが防止され、より自然な言葉として聴くことができ
る。
Further, in the speech speed conversion device of the second embodiment, each time a silent period 17 that is present in the middle of a conversation or a narration and has a threshold time T S or more occurs, the speech speed magnification Y is increased. The speed is changed in the increasing direction. Therefore, it is possible to prevent the speech speed from being changed in the middle of one word or one sentence, and to listen as a more natural word.

【0058】図8は、実際の会話(ナレーション)の話
速を、通常話速(Y=1)から中間話速(1<Y<A)
から目標話速(Y=A)まで変化させた場合における出
力端子12から出力される音声信号a4の波形を示す図
である。図示するように、話速倍率Yが高くなると、各
母音を構成する複数の有声音3が間引かれることが理解
できる。
FIG. 8 shows the actual conversation speed (narration) from the normal speech speed (Y = 1) to the intermediate speech speed (1 <Y <A).
From a diagram showing the waveform of the audio signal a 4 output from the output terminal 12 in the case of changing to the target speech speed (Y = A). As shown in the figure, it can be understood that when the voice speed magnification Y increases, a plurality of voiced sounds 3 constituting each vowel are thinned out.

【0059】(第3実施形態)次に本発明の第3実施形
態の話速変換装置を説明する。この第3実施形態の話速
変換装置のハード構成は図4に示す第2実施形態の話速
変換装置と同じである。そして、異なるところは、話速
算出部14aのソフト構成のみである。
(Third Embodiment) Next, a speech speed converter according to a third embodiment of the present invention will be described. The hardware configuration of the speech speed conversion device of the third embodiment is the same as that of the speech speed conversion device of the second embodiment shown in FIG. The only difference is the software configuration of the speech speed calculation unit 14a.

【0060】すなわち、この第3実施形態の話速変換装
置における話速算出部14aは、図10に示すように、
音声信号a2における無音期間17の継続時間T1がしき
い値時間TSを超える毎に、該当無音期間17の次に来
る無声音2又は有声音3からなる有音期間16の開始時
刻からの経過時間Tの増加に伴って通常話速(Y=1)
から通常話速より速い目標話速倍率Mまで変化し、その
後目標話速倍率Mを維持する話速倍率Yを順次算出して
信号合成部9へ送出する。
That is, the speech speed calculator 14a in the speech speed converter of the third embodiment, as shown in FIG.
Every time the duration T 1 of the silent period 17 in the audio signal a 2 exceeds the threshold time T S , from the start time of the voiced period 16 consisting of the unvoiced sound 2 or voiced sound 3 following the relevant silent period 17. Normal speech speed (Y = 1) as the elapsed time T increases
To the target speech speed M which is higher than the normal speech speed, and thereafter the speech speed Y which keeps the target speech speed M is sequentially calculated and sent to the signal synthesizing unit 9.

【0061】具体的には、図9に示す処理を実施する。
図9において、図10における音声信号a2の無音期間
17の継続時間T1がしきい値時間TSを超えたことを示
す時間経過フラグFを初期値0に設定(F=0)する
(Q1)。
Specifically, the processing shown in FIG. 9 is performed.
In FIG. 9, a time lapse flag F indicating that the duration T 1 of the silence period 17 of the audio signal a 2 in FIG. 10 exceeds the threshold time T S is set to an initial value 0 (F = 0) (FIG. 10). Q1).

【0062】微小時間Δtが経過すると(Q2)、その
時点における音声信号a2の解析結果を読取る(Q
3)。そして、解析結果が無音期間17の場合(Q
4)、Q5にて、無音期間17の継続時間T1を更新す
る(T1=T1+Δt)。
When the short time Δt has elapsed (Q2), the analysis result of the audio signal a 2 at that time is read (Q2).
3). When the analysis result is the silent period 17 (Q
4), in the Q5, to update the duration T 1 of the silent period 17 (T 1 = T 1 + Δt).

【0063】更新後の継続時間T1がしきい値時間TS
経過していない場合は(Q6)、Q2へ戻り、微小時間
Δtの経過を待つ。更新後の継続時間T1がしきい値時
間TSを経過した場合は(Q6)、この継続時間T1を0
にクリアし(Q7)、時間経過フラグFが0のままであ
る場合(Q8)、この無音期間17で初めて、継続時間
1がしきい値時間TSを経過したので、この時間経過フ
ラグFを1に設定する(Q9)。そして、Q10にて、
話速倍率Yを変化させるための経過時間Tを0に初期化
する(T=0)。
If the updated continuation time T 1 has not exceeded the threshold time T S (Q 6), the flow returns to Q 2 and waits for the lapse of the minute time Δt. If the updated duration T 1 has exceeded the threshold time T S (Q6), the duration T 1 is set to 0.
(Q7), and if the time lapse flag F remains 0 (Q8), the duration T 1 has exceeded the threshold time T S for the first time in the silence period 17, so that the time lapse flag F Is set to 1 (Q9). And in Q10,
The elapsed time T for changing the voice speed magnification Y is initialized to 0 (T = 0).

【0064】なお、Q8にて、時間経過フラグFが既に
1に設定されていた場合は、なにもせずにQ2へ戻る。
Q4にて、無音期間17の場合は、Q11にて、経過時
間Tを更新し(T=T+Δt)、時間経過フラグFが1
に設定されていた場合は(Q12)、この時間経過フラ
グFを0に解除し、かつ経過時間Tを0にクリアする
(Q13)。そして、Q14へ進む。なお、Q12で既
に時間経過フラグFが0に解除されていた場合はそのま
まQ14へ進む。
If the time lapse flag F has already been set to 1 at Q8, the process returns to Q2 without doing anything.
In Q4, in the case of the silent period 17, the elapsed time T is updated in Q11 (T = T + Δt), and the time elapsed flag F is set to 1
Is set to (Q12), the elapsed time flag F is cleared to 0, and the elapsed time T is cleared to 0 (Q13). Then, the process proceeds to Q14. If the time lapse flag F has already been cleared to 0 in Q12, the process directly proceeds to Q14.

【0065】Q14においては、下式を用いて、話速倍
率Yを算出する。
In Q14, the speech speed magnification Y is calculated using the following equation.

【0066】 Y=A―(A―1)exp[―T/(TB/5)] 算出した話速倍率Yを信号合成部9へ設定する(Q1
5)。
Y = A− (A−1) exp [−T / (T B / 5)] The calculated speech speed magnification Y is set in the signal synthesizing unit 9 (Q 1
5).

【0067】このように構成された第3実施形態の話速
変換装置において、図10に示す信号波形を有した無声
音2又は有声音3からなる有音時間16と無音4からな
る無音期間17とに区分けされた音声信号a2が話速算
出部14aへ入力された場合を考える。
In the speech speed converter according to the third embodiment having the above-described structure, the voiced time 16 composed of the unvoiced sound 2 or the voiced sound 3 having the signal waveform shown in FIG. audio signal a 2 which is divided into consider the case where input to the speech rate calculation unit 14a.

【0068】この場合、1番目の有音期間17におい
て、話速は目標話速(Y=A)まで増加するように変化
する。1番目の無音期間17が到来しても、この無音期
間17の継続期間T1はしきい値時間TSより短いので、
話速は元に戻らない。そして、1番目の有音期間16に
おいも話速は変化を続け、目標話速(Y=A)に達する
と、この目標話速(Y=A)を維持する。
In this case, during the first sound period 17, the speech speed changes so as to increase to the target speech speed (Y = A). Even if the first silent period 17 arrives, the duration T 1 of the silent period 17 is shorter than the threshold time T S ,
The speech speed does not return. Then, the speech speed continues to change in the first sound period 16 and when the speech speed reaches the target speech speed (Y = A), the target speech speed (Y = A) is maintained.

【0069】2番目の無音期間17が到来すると、この
無音期間17の継続時間T1はしき値時間TSより長いの
で、次の3番目の有音期間16の開始時に話速は元に戻
る。そして、再度話速は目標話速(Y=A)まで増加す
るように変化を開始する。
When the second silence period 17 arrives, the duration T 1 of the silence period 17 is longer than the threshold time T S , so that the speech speed returns to the original speed at the start of the next third speech period 16. . Then, the speech speed starts changing again so as to increase to the target speech speed (Y = A).

【0070】したがって、図11に示すように、一連の
音声信号aの開始時刻から終了時刻までの全区間におい
て、話速は通常話速(Y=1)から目標話速(Y=A)
への変化を繰り返す。
Therefore, as shown in FIG. 11, in the entire section from the start time to the end time of the series of voice signals a, the speech speed changes from the normal speech speed (Y = 1) to the target speech speed (Y = A).
Repeat the change to.

【0071】したがって、会話やナレーションの途中に
存在するしきい値時間以上の無音期間が発生する毎に、
話速が通常話速からこの通常話速よる速い目標話速まで
変化するので、上述した第1実施形態の話速変換装置と
ほぼ同様の作用効果を奏することが可能である。
Therefore, every time a silent period longer than the threshold time that occurs during conversation or narration occurs,
Since the speech speed changes from the normal speech speed to the target speech speed which is higher than the normal speech speed, it is possible to achieve substantially the same operation and effect as the speech speed conversion device of the first embodiment described above.

【0072】なお、本発明は上述した実施形態に限定さ
れるものではない。第1、第2、第3実施形態の話速変
換装置においては、図12におけるD特性に示すよう
に、話速が通常話速(Y=1)から、目標話速(Y=
A)への変化を開始するタイミングを音声信号a
(a2)の有音期間16における先頭の無声音2の開始
位置に設定した。
The present invention is not limited to the above embodiment. In the speech speed conversion devices of the first, second, and third embodiments, as shown by the D characteristic in FIG. 12, the speech speed changes from the normal speech speed (Y = 1) to the target speech speed (Y =
The timing for starting the change to A) is determined by the audio signal a.
The start position of the first unvoiced sound 2 in the sound period 16 of (a 2 ) was set.

【0073】しかし、図12におけるE特性に示すよう
に、話速が通常話速(Y=1)から目標話速(Y=A)
への変化を開始するタイミングを音声信号a(a2)の
有音期間16の先頭の有声音3の開始位置に設定するこ
とも可能である。
However, as shown by the E characteristic in FIG. 12, the speech speed changes from the normal speech speed (Y = 1) to the target speech speed (Y = A).
It is also possible to set the timing to start changing to the start position of the voiced sound 3 at the beginning of the voiced period 16 of the audio signal a (a 2 ).

【0074】音声の冒頭部分における「シーッ」や「チ
ーッ」等の無声音2はあまり意味をなさず、有声音3が
意味をなす場合が多い。したがって、図12におけるE
特性に示すように、有声音3の開始時刻から話速の変化
を開始するのが望ましい。
The unvoiced sound 2 such as "sheep" or "chee" at the beginning of the voice does not make much sense, and the voiced sound 3 often makes sense. Therefore, E in FIG.
As shown in the characteristics, it is desirable to start changing the speech speed from the start time of the voiced sound 3.

【0075】なお、本発明は上述した各実施形態に限定
されるものではない。各実施形態の話速変換装置におい
ては、図1、図4に示すように、A/D変換器6を設け
て、入力端子5から入力されたアナログの音声信号をデ
ジタルの音声信号に変換して音声信号メモリ7へ書込む
ようにした。さらに、出力バッファ10から出力された
話速変化処理した後のデジタルの音声信号をD/A変換
器11を用いてアナログの音声信号に変換して出力端子
12から出力するようにした。
The present invention is not limited to the above embodiments. In the speech speed converter of each embodiment, as shown in FIGS. 1 and 4, an A / D converter 6 is provided to convert an analog audio signal input from the input terminal 5 into a digital audio signal. To be written into the audio signal memory 7. Further, the digital audio signal output from the output buffer 10 and subjected to the speech speed change processing is converted into an analog audio signal using the D / A converter 11 and output from the output terminal 12.

【0076】しかし、既にコンピユータ等でデジタル処
理されたデジタルの音声信号に対して話速変化処理を実
施したり、話速変化処理した後のデジタルの音声信号を
再度コンピユータ等でデジタル処理する場合において
は、図1、図4の鎖線で示すように、入力端子5aから
デジタルの音声信号を直接音声信号メモリ7へ入力す
る。また、出力バッファ10から出力された話速変化処
理した後のデジタルの音声信号を直接出力端子12aへ
出力する。
However, when a speech speed change process is performed on a digital voice signal that has already been digitally processed by a computer or the like, or when the digital voice signal after the speech speed change process is digitally processed again by a computer or the like, Inputs a digital audio signal directly from the input terminal 5a to the audio signal memory 7 as shown by a chain line in FIGS. Also, the digital audio signal output from the output buffer 10 and subjected to the speech speed change processing is directly output to the output terminal 12a.

【0077】[0077]

【発明の効果】以上説明したように、本発明の話速変換
装置においては、話し始めは通常の話速で開始し、規定
時間経過までにその話速を目標話速まで次第に速くして
いようにしている。
As described above, in the speech speed conversion apparatus according to the present invention, the speech starts at the normal speech speed, and the speech speed is gradually increased to the target speech speed by the lapse of the specified time. I have to.

【0078】したがって、たとえ話し速度を速く設定し
たとしても、会話又はナレーションの冒頭部分も正確に
聞き分けることができ、語学学習者にとって、この話速
変換装置が組込まれた語学学習機器の使い勝手を大幅に
向上できる。
Therefore, even if the speaking speed is set to be high, the beginning of the conversation or the narration can be accurately distinguished, and the language learner can easily use the language learning device incorporating the speech speed conversion device. Can be improved.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の第1実施形態に係わる話速変換装置の
概略構成を示すブロック図
FIG. 1 is a block diagram showing a schematic configuration of a speech speed conversion device according to a first embodiment of the present invention;

【図2】同話速変換装置に組込まれた話速算出部の話速
倍率の算出処理を示す流れ図
FIG. 2 is a flowchart showing a calculation process of a speech speed magnification of a speech speed calculation unit incorporated in the same speech speed conversion device.

【図3】同話速変換装置における話速の変化を示す図FIG. 3 is a diagram showing a change in speech speed in the same speech speed conversion device.

【図4】本発明の第2実施形態に係わる話速変換装置の
概略構成を示すブロック図
FIG. 4 is a block diagram showing a schematic configuration of a speech speed conversion device according to a second embodiment of the present invention;

【図5】同話速変換装置に組込まれた話速算出部の話速
倍率の算出処理を示す流れ図
FIG. 5 is a flowchart showing a calculation process of a speech speed magnification of a speech speed calculation unit incorporated in the same speech speed conversion device.

【図6】同話速変換装置における話速の変化を示す図FIG. 6 is a diagram showing a change in speech speed in the same speech speed conversion device.

【図7】同話速変換装置の動作を説明するための音声信
号波形を示す図
FIG. 7 is a diagram showing an audio signal waveform for explaining the operation of the same speech speed conversion device.

【図8】同話速変換装置の出力端子から出力されたそれ
ぞれ話速が異なる音声信号派遣を示す図
FIG. 8 is a diagram showing the transmission of audio signals having different voice speeds output from the output terminal of the voice speed converter.

【図9】本発明の第3実施形態に係わる話速変換装置に
組込まれた話速算出部の話速倍率の算出処理を示す流れ
FIG. 9 is a flowchart showing a process of calculating a speech speed magnification of a speech speed calculation unit incorporated in a speech speed conversion device according to a third embodiment of the present invention.

【図10】同話速変換装置の動作を説明するための音声
信号波形を示す図
FIG. 10 is a diagram showing an audio signal waveform for explaining the operation of the same speech speed conversion device.

【図11】同話速変換装置における話速の変化特性を示
す図
FIG. 11 is a diagram showing a change characteristic of a voice speed in the voice speed converter.

【図12】話速変換装置の変形例における話速の変化特
性を示す図
FIG. 12 is a diagram showing a change characteristic of a speech speed in a modification of the speech speed conversion device.

【図13】一般的な音声信号波形を示す図FIG. 13 is a diagram showing a general audio signal waveform.

【図14】一般的な音声信号の詳細を示す図FIG. 14 is a diagram showing details of a general audio signal.

【符号の説明】[Explanation of symbols]

2…無声音 3…有声音 4…無音 5…入力端子 6…A/D変換器 7…音声信号メモリ 8…音声解析部 9…信号合成部 10…出力バッファ 11…D/A変換器 12…出力端子 13…有音検出部 14,14a…話速算出部 16…有音期間 17…無音期間 18…時間設定部 19…目標話速設定部 20…ステップ数設定部 2 unvoiced sound 3 voiced sound 4 silent 5 input terminal 6 A / D converter 7 audio signal memory 8 audio analyzer 9 signal synthesizer 10 output buffer 11 D / A converter 12 output Terminal 13: Voice detection unit 14, 14a: Voice speed calculation unit 16: Voice period 17: Silence period 18: Time setting unit 19: Target voice speed setting unit 20: Step number setting unit

Claims (5)

【特許請求の範囲】[Claims] 【請求項1】 入力されたデジタルの音声信号を記憶す
る音声信号メモリ(7)と、この音声信号メモリから出
力されたデジタルの音声信号を解析する音声解析部
(8)と、この音声解析部で解析されたデジタルの音声
信号を合成して指定された話速を有する新たな音声信号
として出力する信号合成部(9)とを備えた話速変換装
置において、 前記入力された音声信号における最初の有音を検出する
有音検出手段(13)と、 この有声音検出手段の有音検出時刻から規定時間
(TB)経過するまでの期間内に、時間経過に伴って通
常話速より速い目標話速まで変化させ、かつ前記規定時
間経過後に、前記目標話速を維持する話速を順次算出し
て前記信号合成部へ送出する話速算出部(14)とを備
えたことを特徴とする話速変換装置。
1. An audio signal memory (7) for storing an input digital audio signal, an audio analysis unit (8) for analyzing a digital audio signal output from the audio signal memory, and an audio analysis unit A signal synthesizing unit (9) for synthesizing the digital audio signal analyzed in (1) and outputting it as a new audio signal having a specified speech speed. Voice detection means (13) for detecting the presence of voice, and within a period from the voice detection time of the voice detection means until a lapse of a specified time (T B ), the voice speed is higher than the normal voice speed with the lapse of time. A speech speed calculation unit (14) for changing the speech speed to a target speech speed and sequentially calculating the speech speed for maintaining the target speech speed after the lapse of the specified time, and sending the speech speed to the signal synthesizing unit. Speaking speed converter.
【請求項2】 入力されたデジタルの音声信号を記憶す
る音声信号メモリ(7)と、この音声信号メモリから出
力されたデジタルの音声信号を無声音と有声音と無音と
に区分けする音声解析部(8)と、この音声解析部で区
分けされた有声音のみを指定された話速に対応して間引
き、前記無声音と間引かれた後の有声音と前記無音とを
接続して新たな音声信号を合成する信号合成部(9)と
を備えた話速変換装置において、 前記入力された音声信号の開始時刻から規定時間
(TB)経過するまでの期間内に、時間経過に伴って通
常話速より速い目標話速まで変化させ、かつ前記規定時
間経過後、前記目標話速を維持する話速を順次算出して
前記信号合成部へ送出する話速算出部(14a)を備え
たことを特徴とする話速変換装置。
2. An audio signal memory (7) for storing an input digital audio signal, and an audio analysis unit (11) for dividing the digital audio signal output from the audio signal memory into unvoiced sound, voiced sound, and silent sound. 8) and thinning out only the voiced sounds classified by the voice analysis unit in accordance with the specified speech speed, and connecting the unvoiced sound, the decimated voiced sound and the unvoiced sound to form a new voice signal. And a signal synthesizing unit (9) for synthesizing the normal speech with a lapse of time within a period from a start time of the input audio signal until a lapse of a specified time (T B ). A speech speed calculation unit (14a) that changes the speech speed to a target speech speed higher than the speed and after the lapse of the prescribed time, sequentially calculates a speech speed that maintains the target speech speed and sends the speech speed to the signal synthesis unit. Characteristic speech speed converter.
【請求項3】 前記入力された音声信号の開始時刻は、
この音声信号における前記音声解析部で区分された最初
の有声音の開始時刻であること特徴とする請求項2記載
の話速変換装置。
3. The start time of the input audio signal is:
3. The speech speed conversion device according to claim 2, wherein the speech signal is a start time of a first voiced sound segmented by the speech analysis unit in the speech signal.
【請求項4】 前記話速算出部は、 前記音声解析部が前記音声信号における各無音におけ無
音開始時刻から該当無音の継続期間を計時する無音継続
期間計時手段と、 この無音継続期間計時手段がしきい値時間を計時する毎
に、計時回数に応じて増加する話速を算出する話速不連
続算出手段とを備えたことを特徴とする請求項2又は3
記載の話速変換装置。
4. The speech speed calculation section, wherein the speech analysis section counts a duration of the silence from a silence start time in each silence in the speech signal, and a silence duration timer; 4. A speech speed discontinuity calculation means for calculating a speech speed which increases in accordance with the number of times each time the threshold time is counted.
The described speech speed conversion device.
【請求項5】 入力されたデジタルの音声信号を記憶す
る音声信号メモリ(7)と、この音声信号メモリから出
力されたデジタルの音声信号を無声音と有声音と無音と
に区分けする音声解析部(8)と、この音声解析部で区
分けされた有声音のみを指定された話速に対応して間引
き、前記無声音と間引かれた後の有声音と前記無音とを
接続して新たな音声信号を合成する信号合成部(9)と
を備えた話速変換装置において、 前記音声解析部が前記音声信号における各無音におけ無
音開始時刻から該当無音の継続期間を計時する無音継続
期間計時手段と、 この無音継続期間計時手段がしきい値時間を計時する毎
に、該当無音の次に来る無声音又は有声音の開始時刻か
ら時間経過に伴って通常話速より速い目標話速まで変化
させ、その後前記目標話速を維持する話速を順次算出し
て前記信号合成部へ送出する話速算出部とを備えたこと
を特徴とする話速変換装置。
5. An audio signal memory (7) for storing an input digital audio signal, and an audio analysis unit (11) for classifying the digital audio signal output from the audio signal memory into unvoiced sound, voiced sound, and non-voiced sound. 8) and thinning out only the voiced sounds classified by the voice analysis unit in accordance with the specified speech speed, and connecting the unvoiced sound, the decimated voiced sound and the unvoiced sound to form a new voice signal. And a signal synthesizing unit (9) for synthesizing the audio signal. The audio analysis unit measures the duration of the silence from the silence start time for each silence in the audio signal. Every time the silence duration timer counts the threshold time, it changes from the start time of the unvoiced sound or voiced sound that follows the corresponding silence to the target speech speed higher than the normal speech speed with the lapse of time, and thereafter The goal Speech speed conversion apparatus characterized by comprising a speech rate calculation unit sequentially calculates the speaking speed to maintain a fast delivery to the signal combining unit.
JP33315599A 1999-11-24 1999-11-24 Speech speed converter Withdrawn JP2001154684A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP33315599A JP2001154684A (en) 1999-11-24 1999-11-24 Speech speed converter

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP33315599A JP2001154684A (en) 1999-11-24 1999-11-24 Speech speed converter

Publications (1)

Publication Number Publication Date
JP2001154684A true JP2001154684A (en) 2001-06-08

Family

ID=18262915

Family Applications (1)

Application Number Title Priority Date Filing Date
JP33315599A Withdrawn JP2001154684A (en) 1999-11-24 1999-11-24 Speech speed converter

Country Status (1)

Country Link
JP (1) JP2001154684A (en)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005084692A (en) * 2003-09-10 2005-03-31 Microsoft Corp System and method for providing high-quality expansion and compression of digital audio signal
US7672840B2 (en) 2004-07-21 2010-03-02 Fujitsu Limited Voice speed control apparatus
JP2010266778A (en) * 2009-05-18 2010-11-25 Panasonic Corp Reproduction device
KR101348906B1 (en) * 2012-09-06 2014-01-13 주식회사 보이스웨어 The method of speaking rate conversion in speech synthesis system
JP2015215503A (en) * 2014-05-12 2015-12-03 日本電信電話株式会社 Voice recognition method, voice recognition device and voice recognition program

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005084692A (en) * 2003-09-10 2005-03-31 Microsoft Corp System and method for providing high-quality expansion and compression of digital audio signal
US7672840B2 (en) 2004-07-21 2010-03-02 Fujitsu Limited Voice speed control apparatus
JP2010266778A (en) * 2009-05-18 2010-11-25 Panasonic Corp Reproduction device
KR101348906B1 (en) * 2012-09-06 2014-01-13 주식회사 보이스웨어 The method of speaking rate conversion in speech synthesis system
JP2015215503A (en) * 2014-05-12 2015-12-03 日本電信電話株式会社 Voice recognition method, voice recognition device and voice recognition program

Similar Documents

Publication Publication Date Title
CA2257298C (en) Non-uniform time scale modification of recorded audio
Arons Techniques, perception, and applications of time-compressed speech
CA2253749C (en) Method and device for instantly changing the speed of speech
JPS5982608A (en) System for controlling reproducing speed of sound
JP2001184100A (en) Speaking speed converting device
JP3553828B2 (en) Voice storage and playback method and voice storage and playback device
JP2001154684A (en) Speech speed converter
JP4778402B2 (en) Pause time length calculation device, program thereof, and speech synthesizer
JP2000081897A (en) Method of recording speech information, speech information recording medium, and method and device of reproducing speech information
US7092884B2 (en) Method of nonvisual enrollment for speech recognition
JP2734028B2 (en) Audio recording device
JP3081469B2 (en) Speech speed converter
KR100359988B1 (en) real-time speaking rate conversion system
JP4381108B2 (en) Time signal processor in speech speed converter
JP7432879B2 (en) speech training system
JPH0772896A (en) Device for compressing/expanding sound
JP3201327B2 (en) Recording and playback device
JPH09146575A (en) Uttering speed detecting method
KR20010029111A (en) Apparatus For Foreign Language Listening Aid
JPH11143496A (en) Sound recording and reproducing device
JP2000162954A (en) Device for learning language and electronic apparatus provided therewith
JP2005331588A (en) Method and program to adjust voice reproducing speed and recording medium which stores the program
JP3830200B2 (en) Human image synthesizer
JPS5816295A (en) Voice analyzation/synthesization system
KR100384898B1 (en) A method of audio/video synchronization for speaking rate control

Legal Events

Date Code Title Description
A761 Written withdrawal of application

Free format text: JAPANESE INTERMEDIATE CODE: A761

Effective date: 20041214