JP2001318700A - Speech speed converter - Google Patents

Speech speed converter

Info

Publication number
JP2001318700A
JP2001318700A JP2001014067A JP2001014067A JP2001318700A JP 2001318700 A JP2001318700 A JP 2001318700A JP 2001014067 A JP2001014067 A JP 2001014067A JP 2001014067 A JP2001014067 A JP 2001014067A JP 2001318700 A JP2001318700 A JP 2001318700A
Authority
JP
Japan
Prior art keywords
voice
speed
speech
data
rate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001014067A
Other languages
Japanese (ja)
Inventor
Tatsuo Inoue
健生 井上
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sanyo Electric Co Ltd
Original Assignee
Sanyo Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sanyo Electric Co Ltd filed Critical Sanyo Electric Co Ltd
Priority to JP2001014067A priority Critical patent/JP2001318700A/en
Publication of JP2001318700A publication Critical patent/JP2001318700A/en
Pending legal-status Critical Current

Links

Abstract

PROBLEM TO BE SOLVED: To provide a speech speed conversion in which the amount of accumulation of unread voice data in a voice data accumulation memory does not exceed the capacity of the memory without greatly increasing the speech speed of output voice even though the amount of the accumulation of the unread voice data in the memory is increased. SOLUTION: The speech speed converter is provided with a speech speed conversion processing means which conducts speech speed conversion processes for input voice signals inputted from a voice reproducing device, a voice data accumulation memory into which the output of the speech speed conversion processing means is written, a voice data reading means which reads voice data from the memory, a computing means which computes the accumulation rate of unread voice data in the memory and a control means which controls the reproducing speed of the voice reproducing device in accordance with the accumulation rate of the unread voice data in the memory.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】この発明は、話速変換装置に
関する。
The present invention relates to a speech speed conversion device.

【0002】[0002]

【従来の技術】VTRの高速再生時において、ビデオテ
ープから読み取られた音声信号のうち、無音区間の音声
信号を削除し、音声区間の音声信号を時間軸圧縮伸長部
によって時間軸上において圧縮し、音声区間の音声をユ
ーザによって設定されたVTRの再生速度(設定再生速
度)より遅い速度で出力する話速変換装置が知られてい
る(特開平7−192392号参照)。
2. Description of the Related Art During high-speed reproduction of a VTR, audio signals in a silent section are deleted from audio signals read from a video tape, and audio signals in an audio section are compressed on a time axis by a time axis compression / expansion unit. There is also known a speech speed conversion device that outputs a voice in a voice section at a speed lower than a VTR playback speed (set playback speed) set by a user (see Japanese Patent Application Laid-Open No. 7-192392).

【0003】このような話速変換装置では、入力音声の
話速を遅くして出力する際に入力音声と出力音声との間
に生じる時間的な遅延量を吸収するためのリングメモリ
(音声データ蓄積用メモリ)が設けられている。リング
メモリ内の未読み出しの音声データの蓄積量が、リング
メモリの容量を越えると、出力される音声区間の音声に
途切れが生じる。
In such a speech speed conversion device, a ring memory (speech data) for absorbing a temporal delay generated between the input speech and the output speech when the speech speed of the input speech is reduced and outputted. (Storage memory). When the storage amount of unread audio data in the ring memory exceeds the capacity of the ring memory, the audio in the output audio section is interrupted.

【0004】そこで、リングメモリ内の未読み出しの音
声データの蓄積量がリングメモリの容量を越えないよう
にするために、リングメモリ内の未読み出しの音声デー
タの蓄積量が所定量を越えたときに、時間軸圧縮伸長部
の圧縮率を変化させている。しかしながら、このように
すると、出力音声速度が速くなるという問題がある。
In order to prevent the storage amount of the unread voice data in the ring memory from exceeding the capacity of the ring memory, the storage amount of the unread voice data in the ring memory exceeds a predetermined amount. Next, the compression ratio of the time axis compression / expansion unit is changed. However, in this case, there is a problem that the output sound speed is increased.

【0005】また、高齢者等への聴覚補助または語学学
習のために、テープレコーダ等の音声再生装置から出力
される音声の話速を遅くする話速変換装置が実用化され
ているが、この場合にも同様な問題がある。
[0005] Further, a speech speed conversion device for reducing the speech speed of speech output from a speech reproducing device such as a tape recorder has been put to practical use for assisting hearing or language learning for the elderly and the like. There is a similar problem in the case.

【0006】[0006]

【発明が解決しようとする課題】この発明は、音声デー
タ蓄積用メモリ内の未読み出しの音声データの蓄積量が
増加した場合でも、出力音声の話速をさほど速くさせる
ことなく、音声データ蓄積用メモリ内の未読み出しの音
声データの蓄積量が音声データ蓄積用メモリの容量を越
えないようにすることができる話速変換装置を提供する
ことを目的とする。
SUMMARY OF THE INVENTION According to the present invention, even if the storage amount of unread voice data in the voice data storage memory increases, the voice data storage speed is not increased so much. An object of the present invention is to provide a speech speed conversion device capable of preventing the storage amount of unread voice data in a memory from exceeding the capacity of a voice data storage memory.

【0007】[0007]

【課題を解決するための手段】この発明による第1の話
速変換装置は、音声再生装置から入力される入力音声信
号を話速変換処理する話速変換処理手段、話速変換処理
手段の出力が書き込まれる音声データ蓄積用メモリ、お
よび音声データ蓄積用メモリから音声データを読み出す
手段を備えた話速変換装置において、音声データ蓄積用
メモリ内の未読み出しの音声データの蓄積率を算出する
算出手段、および音声データ蓄積用メモリ内の未読み出
しの音声データの蓄積率に応じて、音声再生装置の再生
速度を制御する制御手段を備えていることを特徴とす
る。
According to a first aspect of the present invention, there is provided a first speech speed conversion device for performing speech speed conversion processing of an input speech signal input from an audio reproduction device, and an output of the speech speed conversion processing device. Calculating means for calculating a storage rate of unread voice data in the voice data storage memory in a speech speed conversion device having a voice data storage memory into which voice data is written, and voice data reading means from the voice data storage memory. And control means for controlling the reproduction speed of the audio reproduction device in accordance with the accumulation rate of unread audio data in the audio data storage memory.

【0008】話速変換処理手段としては、たとえば、入
力音声信号が音声区間であるか無音区間であるかを判定
する区間判定手段、無音区間であると判定された入力音
声信号を削除処理する削除処理手段、および有音区間で
あると判定された入力音声信号を、メモリ内の未読み出
しの音声データの蓄積率に応じた圧縮率で時間軸圧縮伸
長処理する時間軸圧縮伸長処理手段を備えているものが
用いられる。
The speech speed conversion processing means includes, for example, a section determining means for determining whether an input voice signal is a voice section or a silent section, and a deletion processing for deleting an input voice signal determined to be a silent section. Processing means, and time axis compression / expansion processing means for performing time axis compression / expansion processing on the input audio signal determined to be a sound section at a compression rate corresponding to the accumulation rate of unread audio data in the memory. Is used.

【0009】音声再生装置としては、たとえば、VT
R、ハードディスクレコーダが用いられる。
[0009] As an audio reproducing apparatus, for example, VT
R, a hard disk recorder is used.

【0010】この発明による第2の話速変換装置は、音
声再生装置から入力されるアナログ音声信号を設定され
た再生速度倍率に応じたサンプリング周波数でサンプリ
ングするA/D変換手段、A/D変換手段から出力され
る音声データが入力されるフレームメモリ、フレームメ
モリに所要数の音声データが入力される毎に、それらの
音声データに対して話速変換処理を行なう話速変換処理
手段、話速変換処理手段の出力が書き込まれる音声デー
タ蓄積用メモリ、および音声データ蓄積用メモリから音
声データを読み出す手段を備えた話速変換装置におい
て、音声データ蓄積用メモリ内の未読み出しの音声デー
タの蓄積率を算出する算出手段、および音声データ蓄積
用メモリ内の未読み出しの音声データの蓄積率に応じ
て、音声再生装置の再生速度を制御する制御手段を備え
ていることを特徴とする。
A second speech speed conversion device according to the present invention is an A / D conversion means for sampling an analog audio signal input from an audio reproduction device at a sampling frequency corresponding to a set reproduction speed magnification, and an A / D conversion device. A frame memory to which voice data output from the means is input, and a voice speed conversion processing means for performing voice speed conversion processing on the voice data each time a required number of voice data is input to the frame memory; An audio data storage memory into which an output of a conversion processing unit is written, and a speech rate conversion device having means for reading out audio data from the audio data storage memory, wherein a storage rate of unread audio data in the audio data storage memory Calculating means for calculating the audio data and the accumulation rate of the unread audio data in the audio data storage memory. Characterized in that it comprises a control means for controlling the speed.

【0011】この発明による第3の話速変換装置は、音
声再生装置から入力されるデジタル音声信号が、設定さ
れた再生速度倍率に応じた速度で書き込まれるフレーム
メモリ、フレームメモリに所要数の音声データが入力さ
れる毎に、それらの音声データに対して話速変換処理を
行なう話速変換処理手段、話速変換処理手段の出力が書
き込まれる音声データ蓄積用メモリ、および音声データ
蓄積用メモリから音声データを読み出す手段を備えた話
速変換装置において、音声データ蓄積用メモリ内の未読
み出しの音声データの蓄積率を算出する算出手段、およ
び音声データ蓄積用メモリ内の未読み出しの音声データ
の蓄積率に応じて、音声再生装置の再生速度を制御する
制御手段を備えていることを特徴とする。
A third speech speed conversion device according to the present invention is a frame memory in which a digital audio signal input from an audio reproduction device is written at a speed corresponding to a set reproduction speed magnification, and a required number of voices are stored in the frame memory. Each time data is input, the voice speed conversion processing means for performing voice speed conversion processing on the voice data, the voice data storage memory to which the output of the voice speed conversion processing means is written, and the voice data storage memory In a speech speed conversion device provided with means for reading voice data, a calculating means for calculating a storage rate of unread voice data in a voice data storage memory, and a storage of unread voice data in a voice data storage memory. It is characterized by comprising control means for controlling the playback speed of the audio playback device according to the rate.

【0012】上記第2または第3の話速変換装置におけ
る話速変換処理手段としては、たとえば、フレームメモ
リに入力された所要数の音声データに対応する入力音声
が音声区間であるか無音区間であるかを判定する区間判
定手段、無音区間であると判定された音声データを削除
処理する削除処理手段、および有音区間であると判定さ
れた音声データを、音声データ蓄積用メモリ内の未読み
出しの音声データの蓄積率に応じた圧縮率で時間軸圧縮
伸長処理する時間軸圧縮伸長処理手段を備えているもの
が用いられる。
[0012] The speech speed conversion processing means in the second or third speech speed conversion device includes, for example, an input speech corresponding to a required number of speech data input to the frame memory is a speech section or a silent section. Section determination means for determining whether there is a voice section, deletion processing means for deleting voice data determined to be a silent section, and voice data determined to be a voiced section not yet read in the voice data storage memory. And a time axis compression / expansion processing means for performing time axis compression / expansion processing at a compression rate corresponding to the accumulation rate of the audio data.

【0013】[0013]

【発明の実施の形態】以下、図面を参照して、この発明
の実施の形態について説明する。
Embodiments of the present invention will be described below with reference to the drawings.

【0014】〔1〕第1の実施の形態の説明[1] Description of First Embodiment

【0015】図1は、VTRの高速再生時において、ユ
ーザによって設定されたVTR20の再生速度(設定再
生速度)より遅い速度で音声を出力する話速変換装置の
構成を示している。図1には、図示していないが、VT
Rから出力された映像信号は図示しないモニタに表示さ
れる。
FIG. 1 shows the configuration of a speech speed conversion device that outputs a voice at a speed lower than the playback speed (set playback speed) of the VTR 20 set by the user during high-speed playback of the VTR. Although not shown in FIG. 1, VT
The video signal output from R is displayed on a monitor (not shown).

【0016】VTR20から出力された音声信号は、A
/D変換部1に送られ、たとえば12ビットのデジタル
信号に変換される。
The audio signal output from the VTR 20 is A
The signal is sent to the / D conversion unit 1 and is converted into, for example, a 12-bit digital signal.

【0017】A/D変換部1の出力は、フレームメモリ
2に一旦格納される。区間判定部3、無音区間削除部4
および時間軸圧縮伸長部5は、フレームメモリ2に格納
された1フレーム単位の音声データに対して処理を行な
う。
The output of the A / D converter 1 is temporarily stored in the frame memory 2. Section determination section 3, silent section deletion section 4
The time axis compression / expansion unit 5 performs processing on the audio data in units of one frame stored in the frame memory 2.

【0018】区間判定部3は、1フレーム分の音声デー
タのパワーの平均値、パワーの累積値、振幅平均値、振
幅累積値等に基づいて、入力音声が音声区間であるか、
無音区間であるかを判定する。無音区間削除部4は、区
間判定部3によって無音区間であると判定された音声デ
ータを削除する。無音区間削除部4によって無音区間の
音声データが削除された後の音声データ(音声区間の音
声データ)は、時間軸圧縮伸長部5に送られ、時間軸圧
縮伸長処理が行なわれる。
The section determining unit 3 determines whether the input voice is a voice section based on the average value of the power of the audio data for one frame, the cumulative power value, the average amplitude value, the cumulative amplitude value, and the like.
It is determined whether it is a silent section. The silent section deletion unit 4 deletes the voice data determined by the section determination unit 3 to be a silent section. The audio data (the audio data of the audio section) from which the audio data of the silent section has been deleted by the silent section deletion section 4 is sent to the time axis compression / expansion section 5, where the time axis compression / expansion processing is performed.

【0019】時間軸圧縮伸長部5によって時間軸圧縮伸
長処理が行なわれた音声データは、リングメモリ(音声
データ蓄積用メモリ)6に一旦蓄積される。リングメモ
リ6に蓄積された音声データは、読み出されてD/A変
換部9に送られ、アナログ信号に変換されて一定速度で
出力される。
The audio data subjected to the time axis compression / expansion processing by the time axis compression / expansion section 5 is temporarily stored in a ring memory (audio data storage memory) 6. The audio data stored in the ring memory 6 is read, sent to the D / A converter 9, converted into an analog signal, and output at a constant speed.

【0020】リングメモリ6内の未読み出しの音声デー
タの蓄積率が、蓄積率算出部7によって算出される。こ
こで、リングメモリ6内の未読み出しの音声データの蓄
積率とは、リングメモリ6に記憶できる音声データ総量
に対する未読み出しの音声データの蓄積量の割合〔%〕
をいう。蓄積率算出部7によって算出された蓄積率は適
応話速制御部8に送られるとともにVTR20の再生速
度を制御する再生速度制御部21に送られる。
The storage rate of the unread audio data in the ring memory 6 is calculated by the storage rate calculation unit 7. Here, the storage rate of unread audio data in the ring memory 6 is the ratio [%] of the storage amount of unread audio data to the total amount of audio data that can be stored in the ring memory 6.
Say. The accumulation rate calculated by the accumulation rate calculation unit 7 is sent to the adaptive speech speed control unit 8 and also sent to the playback speed control unit 21 that controls the playback speed of the VTR 20.

【0021】以下の説明において、圧縮率とは、時間軸
圧縮伸長部5への入力信号の時間長(データ数)をP、
上記入力信号に対して時間軸圧縮伸長部5から出力され
る出力信号の時間長(データ数)をQとすると、P/Q
で定義される。また、リングメモリ6内の未読み出しの
音声データの蓄積率を、単に蓄積率ということにする。
In the following description, the compression ratio is defined as P, the time length (number of data) of the input signal to the time axis compression / expansion unit 5,
Assuming that the time length (number of data) of the output signal output from the time axis compression / expansion unit 5 with respect to the input signal is Q, P / Q
Is defined by The storage rate of unread audio data in the ring memory 6 is simply referred to as the storage rate.

【0022】適応話速制御部8は、蓄積率に基づいて時
間軸圧縮伸長部5で用いられる圧縮率を制御する。ま
た、再生速度制御部21は、ユーザによって設定された
VTR20の再生速度倍率(以下、設定再生速度倍率と
いう)と蓄積率とに基づいて、VTR20の実際の再生
速度(実際の再生速度倍率)を制御する。
The adaptive speech speed control section 8 controls the compression rate used in the time axis compression / expansion section 5 based on the accumulation rate. Further, the reproduction speed control unit 21 determines the actual reproduction speed (actual reproduction speed magnification) of the VTR 20 based on the reproduction speed magnification (hereinafter, referred to as a set reproduction speed magnification) and the accumulation rate of the VTR 20 set by the user. Control.

【0023】A/D変換部1の標準サンプリング周波数
およびD/A変換部9の標準サンプリング周波数は、こ
の例では8kHzである。VTR20の再生速度倍率が
Mの場合には、M倍速再生時にA/D変換部1によって
得られるサンプリングデータと、標準再生速度での再生
時にA/D変換部1によって得られるサンプリングデー
タとを一致させるために、A/D変換部1のサンプリン
グ周波数fADは、D/A変換部9のサンプリング周波数
DAのM倍に設定される。したがって、M=2の場合
(2倍速再生時)には、fAD=16kHzとなり、fDA
=8kHzとなる。D/A変換部9のサンプリング周波
数fDAは、再生速度倍率にかかわらず、常に標準サンプ
リング周波数(8kHz)に保たれる。
The standard sampling frequency of the A / D converter 1 and the standard sampling frequency of the D / A converter 9 are 8 kHz in this example. When the reproduction speed magnification of the VTR 20 is M, the sampling data obtained by the A / D conversion unit 1 at the time of M-times reproduction matches the sampling data obtained by the A / D conversion unit 1 at the time of reproduction at the standard reproduction speed. For this purpose, the sampling frequency f AD of the A / D converter 1 is set to M times the sampling frequency f DA of the D / A converter 9. Therefore, when M = 2 (during double-speed playback), f AD = 16 kHz, and f DA
= 8 kHz. The sampling frequency f DA of the D / A converter 9 is always kept at the standard sampling frequency (8 kHz) regardless of the reproduction speed magnification.

【0024】2倍速再生時において、音声を設定再生速
度より遅い速度で出力する場合の適応話速制御部8およ
び再生速度制御部21の動作について説明する。
The operation of the adaptive speech speed control section 8 and the playback speed control section 21 when outputting voice at a speed lower than the set playback speed during double speed playback will be described.

【0025】表1は、設定再生速度倍率が2である場合
の、蓄積率と圧縮率との関係および蓄積率と再生速度倍
率との関係を示している。表1において、メモリ残量率
とは、100から蓄積率〔%〕を減算した値をいう。
Table 1 shows the relationship between the accumulation ratio and the compression ratio and the relationship between the accumulation ratio and the reproduction speed ratio when the set reproduction speed magnification is 2. In Table 1, the remaining memory ratio refers to a value obtained by subtracting the accumulation ratio [%] from 100.

【0026】[0026]

【表1】 [Table 1]

【0027】適応話速制御部8は、表1の蓄積率と圧縮
率との関係を記憶した蓄積率/圧縮率テーブルを備えて
いる。また、再生速度制御部21は、表1の蓄積率と再
生速度倍率との関係を記憶した蓄積率/再生速度倍率テ
ーブルを備えている。
The adaptive speech speed controller 8 has an accumulation rate / compression rate table storing the relationship between the accumulation rate and the compression rate shown in Table 1. Further, the reproduction speed control unit 21 has an accumulation ratio / reproduction speed magnification table in which the relationship between the accumulation ratio and the reproduction speed magnification in Table 1 is stored.

【0028】適応話速制御部8は、蓄積率算出部7から
蓄積率が送られてくると、蓄積率/圧縮率テーブルに基
づいて、蓄積率算出部7から送られてきた蓄積率に対応
する圧縮率を読み出し、時間軸圧縮伸長部5に設定す
る。再生速度制御部21は、蓄積率算出部7から蓄積率
が送られてくると、蓄積率/再生速度倍率テーブルに基
づいて、蓄積率算出部7から送られてきた蓄積率に対応
する再生速度倍率を読み出し、VTR20の再生速度を
読み出した再生速度倍率に応じた速度となるように制御
する。
When the storage rate is sent from the storage rate calculator 7, the adaptive speech speed controller 8 responds to the storage rate sent from the storage rate calculator 7 based on the storage rate / compression rate table. The compression rate to be read is read out and set in the time axis compression / expansion unit 5. When the storage rate is sent from the storage rate calculator 7, the playback speed controller 21 determines the playback speed corresponding to the storage rate sent from the storage rate calculator 7 based on the storage rate / playback speed magnification table. The magnification is read, and the reproduction speed of the VTR 20 is controlled so as to be a speed corresponding to the read reproduction speed magnification.

【0029】(1) 蓄積率が0〜20%(0以上でか
つ20%未満)である場合 蓄積率が0〜20%である場合には、圧縮率は1に設定
され、再生速度倍率は設定再生速度倍率である2に設定
される。この場合には、設定再生速度倍率2に応じた再
生速度でVTR20から出力された音声信号は、A/D
変換部1によってD/A変換部9の標準サンプリング周
波数の2倍の周波数(16kHz)でサンプリングされ
てフレームメモリ2に格納される。
(1) When the accumulation rate is 0 to 20% (0 or more and less than 20%) When the accumulation rate is 0 to 20%, the compression rate is set to 1, and the reproduction speed magnification is It is set to 2 which is the set reproduction speed magnification. In this case, the audio signal output from the VTR 20 at the playback speed corresponding to the set playback speed magnification 2 is A / D
The data is sampled by the converter 1 at a frequency (16 kHz) that is twice the standard sampling frequency of the D / A converter 9 and stored in the frame memory 2.

【0030】フレームメモリ2に格納された音声データ
は、無音区間削除部4によって無音区間のデータが削除
された後、時間軸圧縮伸長部5で時間軸圧縮伸長処理は
行なわれずに、リングメモリ6に蓄積される。リングメ
モリ6に蓄積された音声データは、D/A変換部9によ
って標準サンプリング周波数(8kHz)でサンプリン
グされて出力される。したがって、出力音声の話速は、
標準再生速度(1倍速再生時の再生速度)で再生された
ときの出力音声の話速と等しくなる。
After the audio data stored in the frame memory 2 is deleted in the silent section by the silent section deleting section 4, the time axis compressing / expanding section 5 does not perform the time axis compressing / expanding processing, and the ring memory 6 Is accumulated in The audio data stored in the ring memory 6 is sampled by the D / A converter 9 at a standard sampling frequency (8 kHz) and output. Therefore, the output speech speed is
It becomes equal to the speech speed of the output sound when reproduced at the standard reproduction speed (reproduction speed at 1 × speed reproduction).

【0031】リングメモリ6へのデータ書き込み速度
は、リングメモリ6からのデータ読み出し速度より速い
ので、リングメモリ6内の未読み出しの音声データの蓄
積量が増加していく。未読み出しの音声データの蓄積量
が増加していく速度は、入力音声データに無音区間のデ
ータが少ない程、速くなる。
Since the speed of writing data to the ring memory 6 is faster than the speed of reading data from the ring memory 6, the amount of unread audio data stored in the ring memory 6 increases. The speed at which the storage amount of unread audio data increases increases as the input audio data contains less data in a silent section.

【0032】(2) 蓄積率が20〜40%である場合 蓄積率が20〜40%である場合には、圧縮率が1.2
に設定される。ただし、再生速度倍率は2のままであ
る。この場合には、時間軸圧縮伸長部5は、入力信号の
時間長Pと出力信号の時間長Qとの比が1.2:1とな
るように、入力データに対して時間軸圧縮処理を行な
う。この結果、出力音声の話速は、標準再生速度(1倍
速再生時の再生速度)で再生されたときの出力音声の話
速より若干速くなる。一方、リングメモリ6に入力され
る音声区間の音声データ量が低減されるので、上記
(1)の場合に比べて、リングメモリ6から読み出され
るデータ量に対する、リングメモリ6に書き込まれるデ
ータ量の比を小さくすることができる。
(2) When the accumulation rate is 20 to 40% When the accumulation rate is 20 to 40%, the compression rate is 1.2
Is set to However, the reproduction speed magnification remains at 2. In this case, the time axis compression / expansion unit 5 performs time axis compression processing on the input data so that the ratio of the time length P of the input signal to the time length Q of the output signal becomes 1.2: 1. Do. As a result, the voice speed of the output voice is slightly higher than the voice speed of the output voice when reproduced at the standard reproduction speed (reproduction speed at 1 × speed reproduction). On the other hand, since the amount of voice data in the voice section input to the ring memory 6 is reduced, the amount of data written to the ring memory 6 with respect to the amount of data read from the ring memory 6 is smaller than in the case (1). The ratio can be reduced.

【0033】(3) 蓄積率が40〜60%である場合 蓄積率が40〜60%である場合には、圧縮率が1.4
に設定される。ただし、再生速度倍率は2のままであ
る。この場合には、時間軸圧縮伸長部5は、入力信号の
時間長Pと出力信号の時間長Qとの比が1.4:1とな
るように、入力データに対して時間軸圧縮処理を行な
う。この結果、出力音声の話速は、上記(2)の場合に
比べてさらに速くなる。一方、リングメモリ6に入力さ
れる音声区間の音声データ量が上記(2)の場合に比べ
てさらに低減されるので、上記(2)の場合に比べて、
リングメモリ6から読み出されるデータ量に対する、リ
ングメモリ6に書き込まれるデータ量の比を小さくする
ことができる。
(3) When the accumulation rate is 40 to 60% When the accumulation rate is 40 to 60%, the compression rate is 1.4.
Is set to However, the reproduction speed magnification remains at 2. In this case, the time axis compression / expansion unit 5 performs the time axis compression processing on the input data so that the ratio of the time length P of the input signal to the time length Q of the output signal becomes 1.4: 1. Do. As a result, the speech speed of the output voice is higher than in the case of the above (2). On the other hand, the amount of voice data in the voice section input to the ring memory 6 is further reduced as compared with the case of the above (2).
The ratio of the amount of data written to the ring memory 6 to the amount of data read from the ring memory 6 can be reduced.

【0034】(4) 蓄積率が60〜80%である場合 蓄積率が60〜80%である場合には、圧縮率が1.4
に設定され、再生速度倍率が1.8倍に設定される。こ
の場合には、A/D変換部1のサンプリング周波数fAD
は、D/A変換部9の標準サンプリング周波数fDA
1.8倍に設定される。また、時間軸圧縮伸長部5は、
入力信号の時間長Pと出力信号の時間長Qとの比が1.
4:1となるように、入力データに対して時間軸圧縮処
理を行なう。また、再生速度制御部21は、VTR20
の再生速度を再生速度倍率1.8に応じた速度となるよ
うに制御する。
(4) When the accumulation rate is 60 to 80% When the accumulation rate is 60 to 80%, the compression rate is 1.4.
And the reproduction speed magnification is set to 1.8 times. In this case, the sampling frequency f AD of the A / D converter 1
Is set to 1.8 times the standard sampling frequency f DA of the D / A converter 9. In addition, the time axis compression / expansion unit 5
The ratio of the time length P of the input signal to the time length Q of the output signal is 1.
A time axis compression process is performed on the input data so that the ratio becomes 4: 1. Also, the playback speed control unit 21
Is controlled so as to be a speed corresponding to the reproduction speed magnification 1.8.

【0035】再生速度倍率が1.8に設定されるので、
上記(3)の場合に比べて、リングメモリ6へのデータ
の書き込み速度が低下するため、上記(3)の場合に比
べて、リングメモリ6から読み出されるデータ量に対す
る、リングメモリ6に書き込まれるデータ量の比を小さ
くすることができる。
Since the reproduction speed magnification is set to 1.8,
Since the speed of writing data to the ring memory 6 is lower than in the case (3), the data is written to the ring memory 6 with respect to the amount of data read from the ring memory 6 as compared to the case (3). The ratio of the data amount can be reduced.

【0036】(5) 蓄積率が80〜95%である場合 蓄積率が80〜95%である場合には、圧縮率が1.4
に設定され、再生速度倍率が1.6倍に設定される。こ
の場合には、A/D変換部1のサンプリング周波数fAD
は、D/A変換部9の標準サンプリング周波数fDA
1.6倍に設定される。また、時間軸圧縮伸長部5は、
入力信号の時間長Pと出力信号の時間長Qとの比が1.
6:1となるように、入力データに対して時間軸圧縮処
理を行なう。また、再生速度制御部21は、VTR20
の再生速度を再生速度倍率1.6に応じた速度となるよ
うに制御する。
(5) When the accumulation rate is 80 to 95% When the accumulation rate is 80 to 95%, the compression rate is 1.4.
And the reproduction speed magnification is set to 1.6 times. In this case, the sampling frequency f AD of the A / D converter 1
Is set to 1.6 times the standard sampling frequency f DA of the D / A converter 9. In addition, the time axis compression / expansion unit 5
The ratio of the time length P of the input signal to the time length Q of the output signal is 1.
Time axis compression processing is performed on the input data so that the ratio becomes 6: 1. Also, the playback speed control unit 21
Is controlled so as to be a speed corresponding to the reproduction speed magnification 1.6.

【0037】再生速度倍率が1.6に設定されるので、
上記(4)の場合に比べて、リングメモリ6へのデータ
の書き込み速度が低下するため、上記(4)の場合に比
べて、リングメモリ6から読み出されるデータ量に対す
る、リングメモリ6に書き込まれるデータ量の比を小さ
くすることができる。
Since the reproduction speed magnification is set to 1.6,
Since the speed of writing data to the ring memory 6 is lower than in the case (4), the data is written to the ring memory 6 with respect to the amount of data read from the ring memory 6 as compared to the case (4). The ratio of the data amount can be reduced.

【0038】(6) 蓄積率が95〜100%である場
合 蓄積率が95〜100%である場合には、圧縮率が1.
4に設定され、再生速度倍率が1.4倍に設定される。
この場合には、A/D変換部1のサンプリング周波数f
ADは、D/A変換部9の標準サンプリング周波数fDA
1.4倍に設定される。また、時間軸圧縮伸長部5は、
入力信号の時間長Pと出力信号の時間長Qとの比が1.
4:1となるように、入力データに対して時間軸圧縮処
理を行なう。また、再生速度制御部21は、VTR20
の再生速度を再生速度倍率1.4に応じた速度となるよ
うに制御する。
(6) When the accumulation rate is 95 to 100% When the accumulation rate is 95 to 100%, the compression rate is 1.
4, and the reproduction speed magnification is set to 1.4 times.
In this case, the sampling frequency f of the A / D converter 1
AD is set to 1.4 times the standard sampling frequency f DA of the D / A converter 9. In addition, the time axis compression / expansion unit 5
The ratio of the time length P of the input signal to the time length Q of the output signal is 1.
A time axis compression process is performed on the input data so that the ratio becomes 4: 1. Also, the playback speed control unit 21
Is controlled so as to be a speed corresponding to the reproduction speed magnification of 1.4.

【0039】再生速度倍率が1.4に設定されるので、
上記(5)の場合に比べて、リングメモリ6へのデータ
の書き込み速度が低下するため、上記(5)の場合に比
べて、リングメモリ6から読み出されるデータ量に対す
る、リングメモリ6に書き込まれるデータ量の比を小さ
くすることができる。
Since the reproduction speed magnification is set to 1.4,
Since the speed of writing data to the ring memory 6 is lower than in the case (5), the data is written to the ring memory 6 with respect to the amount of data read from the ring memory 6 compared to the case (5). The ratio of the data amount can be reduced.

【0040】なお、未読み出しの音声データの蓄積率が
小さい場合、たとえば、未読み出しの音声データの蓄積
率が20%未満のときに、無音区間削除部4による削除
動作を停止させるようにしてもよい。
When the storage rate of unread audio data is small, for example, when the storage rate of unread audio data is less than 20%, the deletion operation by the silent section deletion unit 4 may be stopped. Good.

【0041】なお、リングメモリ6として、より容量の
小さいものを用いたい場合には、図2に示すように、リ
ングメモリ6の前段に、時間軸圧縮伸長部5から出力さ
れる音声データを符号化する音声符号化部11を設ける
とともにリングメモリ6の後段に、リングメモリ6から
読み出された符号化データを復号する音声復号化部12
を設ければよい。
When it is desired to use a ring memory 6 having a smaller capacity, the audio data output from the time axis compression / expansion unit 5 is encoded before the ring memory 6 as shown in FIG. And a speech decoding unit 12 for decoding encoded data read from the ring memory 6 at the subsequent stage of the ring memory 6.
May be provided.

【0042】〔2〕第2の実施の形態の説明[2] Description of Second Embodiment

【0043】図3は、テープレコーダ等の音声再生装置
において、音声を標準再生速度より遅い速度で出力する
話速変換装置の構成を示している。図3において、図1
と同じものには同じ符号を付してその説明を省略する。
FIG. 3 shows the configuration of a speech speed conversion device for outputting a voice at a speed lower than the standard playback speed in an audio playback device such as a tape recorder. In FIG. 3, FIG.
The same components as those described above are denoted by the same reference numerals and description thereof will be omitted.

【0044】図3において、30は音声再生装置であ
り、31は音声再生装置30の再生速度制御部である。
In FIG. 3, reference numeral 30 denotes an audio reproducing device, and reference numeral 31 denotes a reproducing speed control section of the audio reproducing device 30.

【0045】音声再生装置30の再生速度倍率がMの場
合には、M倍速再生時にA/D変換部1によって得られ
るサンプリングデータと、標準再生速度での再生時にA
/D変換部1によって得られるサンプリングデータとを
一致させるために、A/D変換部1のサンプリング周波
数fADは、D/A変換部9のサンプリング周波数fDA
M倍に設定される。D/A変換部9のサンプリング周波
数fDAは、再生速度倍率にかかわらず、常に標準サンプ
リング周波数に保たれる。
When the reproduction speed magnification of the audio reproduction device 30 is M, the sampling data obtained by the A / D converter 1 at the M-times speed reproduction and the A / D at the standard reproduction speed.
The sampling frequency f AD of the A / D converter 1 is set to M times the sampling frequency f DA of the D / A converter 9 in order to match the sampling data obtained by the / D converter 1. The sampling frequency f DA of the D / A converter 9 is always kept at the standard sampling frequency regardless of the reproduction speed magnification.

【0046】標準再生速度(1倍速再生時の再生速度)
で再生する場合において、音声を標準再生速度より遅い
速度で出力させる場合の適応話速制御部8および再生速
度制御部31の動作について説明する。
Standard playback speed (playback speed at 1x speed playback)
The operation of the adaptive speech speed control unit 8 and the playback speed control unit 31 in the case of outputting the voice at a speed lower than the standard playback speed in the case of playing back with.

【0047】表2は、設定再生速度倍率が1である場合
の、蓄積率と圧縮率との関係および蓄積率と再生速度倍
率との関係を示している。
Table 2 shows the relationship between the accumulation ratio and the compression ratio and the relationship between the accumulation ratio and the reproduction speed ratio when the set reproduction speed ratio is 1.

【0048】[0048]

【表2】 [Table 2]

【0049】適応話速制御部8は、表2の蓄積率と圧縮
率との関係を記憶した蓄積率/圧縮率テーブルを備えて
いる。また、再生速度制御部31は、表2の蓄積率と再
生速度倍率との関係を記憶した蓄積率/再生速度倍率テ
ーブルを備えている。
The adaptive speech speed controller 8 has an accumulation rate / compression rate table storing the relationship between the accumulation rate and the compression rate shown in Table 2. Further, the reproduction speed control unit 31 includes an accumulation ratio / reproduction speed magnification table in which the relationship between the accumulation ratio and the reproduction speed magnification in Table 2 is stored.

【0050】適応話速制御部8は、蓄積量算出部7から
未読み出しの音声データの蓄積率が送られてくると、蓄
積率/圧縮率テーブルに基づいて、蓄積量算出部7から
送られてきた蓄積率に対応する圧縮率を読み出し、時間
軸圧縮伸長部5に設定する。再生速度制御部31は、蓄
積量算出部7から未読み出しの音声データの蓄積率が送
られてくると、蓄積率/再生速度倍率テーブルに基づい
て、蓄積量算出部7から送られてきた蓄積率に対応する
再生速度倍率を読み出し、音声再生装置30の再生速度
を読み出した再生速度倍率に応じた速度となるように制
御する。
When the storage rate of the unread audio data is sent from the storage amount calculation unit 7, the adaptive speech speed control unit 8 sends the data from the storage amount calculation unit 7 based on the storage ratio / compression ratio table. The compression rate corresponding to the obtained accumulation rate is read out and set in the time axis compression / expansion unit 5. When the storage rate of the unread audio data is sent from the storage amount calculation unit 7, the playback speed control unit 31 stores the storage data sent from the storage amount calculation unit 7 based on the storage ratio / playback speed magnification table. The reproduction speed magnification corresponding to the rate is read, and the reproduction speed of the audio reproduction device 30 is controlled so as to be a speed corresponding to the read reproduction speed magnification.

【0051】(1) 蓄積率が0〜25%である場合 蓄積率が0〜25%である場合には、圧縮率は0.7に
設定され、再生速度倍率は設定再生速度倍率である1に
設定される。この場合には、音声再生装置30から再生
速度倍率が1の速度で出力された音声信号は、A/D変
換部1によってD/A変換部9の標準サンプリング周波
数と同じサンプリング周波数でサンプリングされてフレ
ームメモリ2に格納される。
(1) When the accumulation rate is 0 to 25% When the accumulation rate is 0 to 25%, the compression rate is set to 0.7, and the reproduction speed magnification is 1 which is the set reproduction speed magnification. Is set to In this case, the audio signal output from the audio reproduction device 30 at a reproduction speed magnification of 1 is sampled by the A / D converter 1 at the same sampling frequency as the standard sampling frequency of the D / A converter 9. It is stored in the frame memory 2.

【0052】フレームメモリ2に格納された音声データ
は無音区間削除部4によって無音区間のデータが削除さ
れた後、時間軸圧縮伸長部5に送られる。時間軸圧縮伸
長部5では、入力信号の時間長Pと出力信号の時間長Q
との比が0.7:1となるように、入力データ(音声区
間の音声データ)に対して時間軸伸長処理が行なわれ
る。
The audio data stored in the frame memory 2 is sent to the time axis compression / expansion unit 5 after the data of the silent interval is deleted by the silent interval deletion unit 4. In the time axis compression / expansion unit 5, the time length P of the input signal and the time length Q of the output signal
Is subjected to time axis expansion processing on the input data (audio data in the audio section) so that the ratio of the input data becomes 0.7: 1.

【0053】時間軸圧縮伸長部5によって時間軸伸長処
理が行なわれた後の音声データは、リングメモリ6に蓄
積される。リングメモリ6に蓄積された音声データは、
D/A変換部9によって標準サンプリング周波数でサン
プリングされて出力される。
The audio data after the time axis expansion processing is performed by the time axis compression / expansion unit 5 is stored in the ring memory 6. The voice data stored in the ring memory 6 is
It is sampled at a standard sampling frequency by the D / A converter 9 and output.

【0054】音声区間の音声データは時間軸上で伸長さ
れた後にリングメモリ6に書き込まれているので、出力
音声の話速は標準再生速度で再生されたときの出力音声
の話速より遅くなる。ただし、無音区間の音声データが
少ない程、リングメモリ6内の未読み出しの音声データ
の蓄積量が増加していく。
Since the voice data in the voice section is written in the ring memory 6 after being expanded on the time axis, the speech speed of the output voice is lower than the voice speed of the output voice when reproduced at the standard reproduction speed. . However, the smaller the voice data in the silent section, the larger the storage amount of unread voice data in the ring memory 6.

【0055】(2) 蓄積率が25〜50%である場合 蓄積率が25〜50%である場合には、圧縮率が0.8
に設定される。ただし、再生速度倍率は1のままであ
る。この場合には、時間軸圧縮伸長部5は、入力信号の
時間長Pと出力信号の時間長Qとの比が0.8:1とな
るように、入力データに対して時間軸伸長処理を行な
う。この結果、出力音声の話速は標準再生速度で再生さ
れたときの出力音声の話速より遅いが上記(1)の場合
に比べて若干速くなる。ただし、リングメモリ6に入力
される音声区間の音声データ量が上記(1)の場合に比
べて低減するため、上記(1)の場合に比べて、リング
メモリ6から読み出されるデータ量に対する、リングメ
モリ6に書き込まれるデータ量の比を小さくすることが
できる。
(2) When the accumulation rate is 25 to 50% When the accumulation rate is 25 to 50%, the compression rate is 0.8
Is set to However, the reproduction speed magnification remains at 1. In this case, the time axis compression / expansion unit 5 performs the time axis expansion processing on the input data so that the ratio of the time length P of the input signal to the time length Q of the output signal becomes 0.8: 1. Do. As a result, the voice speed of the output voice is lower than the voice speed of the output voice when reproduced at the standard reproduction speed, but is slightly higher than in the case of the above (1). However, since the voice data amount of the voice section input to the ring memory 6 is reduced as compared with the case of the above (1), the ring data with respect to the data amount read from the ring memory 6 is compared with the case of the above (1). The ratio of the amount of data written to the memory 6 can be reduced.

【0056】(3) 蓄積率が50〜75%である場合 蓄積率が50〜75%である場合には、圧縮率が0.9
に設定され、再生速度倍率が0.9に設定される。この
場合には、A/D変換部1のサンプリング周波数f
ADは、D/A変換部9の標準サンプリング周波数fDA
0.9倍に設定される。
(3) When the accumulation rate is 50 to 75% When the accumulation rate is 50 to 75%, the compression rate is 0.9.
And the reproduction speed magnification is set to 0.9. In this case, the sampling frequency f of the A / D converter 1
AD is set to 0.9 times the standard sampling frequency f DA of the D / A converter 9.

【0057】また、時間軸圧縮伸長部5は、単位時間当
たりのデータ入力個数Pと、単位時間当たりのデータ出
力個数Qとの比が、0.9:1となるように、入力デー
タに対して時間軸伸長処理を行なう。また、再生速度制
御部31は、音声再生装置30の再生速度を再生速度倍
率0.9に応じた速度となるように制御する。
Further, the time axis compression / expansion unit 5 adjusts the input data so that the ratio of the number of data inputs P per unit time to the number of data outputs Q per unit time is 0.9: 1. To extend the time axis. Further, the reproduction speed control unit 31 controls the reproduction speed of the audio reproduction device 30 to be a speed corresponding to the reproduction speed magnification 0.9.

【0058】上記(2)の場合に比べて、時間軸上の圧
縮率が大きくされているとともに、再生速度倍率が上記
(2)に比べて小さくされているので、上記(2)の場
合に比べて、リングメモリ6から読み出されるデータ量
に対する、リングメモリ6に書き込まれるデータ量の比
を小さくすることができる。ただし、再生速度倍率が上
記(2)に比べて小さくされているので、圧縮率のみを
大きくする場合に比べて、出力音声の話速は速くならな
い。
As compared with the case of the above (2), the compression ratio on the time axis is increased, and the reproduction speed magnification is made smaller than that of the above (2). In comparison, the ratio of the amount of data written to the ring memory 6 to the amount of data read from the ring memory 6 can be reduced. However, since the reproduction speed magnification is smaller than that in the above (2), the speaking speed of the output sound is not faster than when only the compression ratio is increased.

【0059】(4) 蓄積率が75〜100%である場
合 蓄積率が75〜100%である場合には、圧縮率が1.
0に設定され、再生速度倍率が0.8倍に設定される。
この場合には、A/D変換部1のサンプリング周波数f
ADは、D/A変換部9の標準サンプリング周波数fDA
0.8倍に設定される。
(4) When the accumulation rate is 75 to 100% When the accumulation rate is 75 to 100%, the compression rate is 1.
0 is set, and the reproduction speed magnification is set to 0.8 times.
In this case, the sampling frequency f of the A / D converter 1
AD is set to 0.8 times the standard sampling frequency f DA of the D / A converter 9.

【0060】また、時間軸圧縮伸長部5は、時間軸伸長
処理を行なわない。再生速度制御部31は、音声再生装
置30の再生速度を再生速度倍率0.8に応じた速度と
なるように制御する。
The time axis compression / expansion unit 5 does not perform the time axis expansion processing. The playback speed control unit 31 controls the playback speed of the audio playback device 30 to be a speed corresponding to a playback speed magnification of 0.8.

【0061】上記(3)の場合に比べて、時間軸上の圧
縮率が大きくされているとともに、再生速度倍率が上記
(3)に比べて小さくされているので、上記(3)の場
合に比べて、リングメモリ6から読み出されるデータ量
に対する、リングメモリ6に書き込まれるデータ量の比
を小さくすることができる。ただし、再生速度倍率が上
記(3)に比べて小さくされているので、圧縮率のみを
大きくする場合に比べて、出力音声の話速は速くならな
い。
As compared with the case of the above (3), the compression ratio on the time axis is increased, and the reproduction speed magnification is made smaller than that of the above (3). In comparison, the ratio of the amount of data written to the ring memory 6 to the amount of data read from the ring memory 6 can be reduced. However, since the reproduction speed magnification is smaller than that in the above (3), the speaking speed of the output sound is not faster than when only the compression ratio is increased.

【0062】なお、未読み出しの音声データの蓄積率が
小さい場合、たとえば、未読み出しの音声データの蓄積
率が20%未満のときに、無音区間削除部4による削除
動作を停止させるようにしてもよい。
When the accumulation rate of unread audio data is low, for example, when the accumulation rate of unread audio data is less than 20%, the deletion operation by the silent section deletion unit 4 may be stopped. Good.

【0063】なお、リングメモリ6として、より容量の
小さいものを用いたい場合には、図3と同様に、リング
メモリ6の前段に、時間軸圧縮伸長部5から出力される
音声データを符号化する音声符号化部を設けるとともに
リングメモリ6の後段に、リングメモリ6から読み出さ
れた符号化データを復号する音声復号化部を設ければよ
い。
When it is desired to use a smaller memory as the ring memory 6, the audio data output from the time axis compression / expansion unit 5 is encoded before the ring memory 6 as in FIG. It is sufficient to provide an audio encoding unit for performing the decoding and an audio decoding unit for decoding the encoded data read from the ring memory 6 at the subsequent stage of the ring memory 6.

【0064】上記第1の実施の形態および第2の実施の
形態では、VTR20または音声再生装置30からアナ
ログの音声信号が送られてくる場合について説明した
が、VTR20または音声再生装置30からデジタルの
音声データが送られてくる場合にもこの発明を適用する
ことができる。この場合には、VTR20または音声再
生装置30から送られてきたデジタルの音声データを再
生速度倍率に応じた書き込み速度でフレームメモリ2に
書き込み、1倍速再生時のフレームメモリ2への音声デ
ータの書き込み速度と同じ速度でリングメモリからデー
タを読み出せばよい。
In the first and second embodiments, the case where an analog audio signal is transmitted from the VTR 20 or the audio reproducing device 30 has been described. The present invention can be applied to a case where voice data is sent. In this case, the digital audio data sent from the VTR 20 or the audio reproduction device 30 is written into the frame memory 2 at a writing speed corresponding to the reproduction speed magnification, and the audio data is written into the frame memory 2 at the time of 1 × speed reproduction. Data may be read from the ring memory at the same speed as the speed.

【0065】〔3〕第3の実施の形態の説明[3] Description of Third Embodiment

【0066】図4は、ハードディスクレコーダの再生回
路に話速変換装置を応用した例を示している。図4にお
いて、図1と同じものには、同じ符号を付してその説明
を省略する。
FIG. 4 shows an example in which a speech speed converter is applied to a reproduction circuit of a hard disk recorder. 4, the same components as those in FIG. 1 are denoted by the same reference numerals, and description thereof will be omitted.

【0067】図4において、40はハードディスクレコ
ーダに設けられかつ音声データが格納されるハードディ
スク(HD)である。41は、再生時において、ハード
ディスク40から読み出された音声データを一時的に格
納するバッファである。42は、バッファ41から音声
データを出力する速度を制御する再生速度制御部であ
る。
In FIG. 4, reference numeral 40 denotes a hard disk (HD) provided in the hard disk recorder and storing audio data. Reference numeral 41 denotes a buffer for temporarily storing audio data read from the hard disk 40 during reproduction. Reference numeral 42 denotes a reproduction speed control unit that controls the speed at which audio data is output from the buffer 41.

【0068】図4においては、ハードディスク40に音
声データを格納するための音声記録回路は省略してい
る。このハードディスクレコーダでは、再生モードとし
て、出力音声が早口になったり、音声情報の欠落を防止
しながら、短時間で再生を行なうための早聞きモード
と、話速を遅くして再生する遅聞きモードとがある。以
下、これらの各再生モード時の動作について説明する。
In FIG. 4, an audio recording circuit for storing audio data on the hard disk 40 is omitted. This hard disk recorder has two playback modes: a fast-listening mode for playing back in a short period of time while preventing the output sound from being played quickly or a loss of audio information, and a slow-listening mode for playing back at a lower speaking speed. There is. The operation in each of these playback modes will be described below.

【0069】〔3−1〕早聞きモード時の動作の説明 表3は、早聞きモード時の、蓄積率と圧縮率との関係お
よび蓄積率とバッファから音声データを出力する速度の
倍率(再生速度倍率)との関係を示している。
[3-1] Description of Operation in Fast Listening Mode Table 3 shows the relationship between the accumulation rate and the compression rate in the fast listening mode, and the magnification of the accumulation rate and the speed at which audio data is output from the buffer (playback). (Speed magnification).

【0070】[0070]

【表3】 [Table 3]

【0071】適応話速制御部8は、表3の蓄積率と圧縮
率との関係を記憶した早聞きモード用の蓄積率/圧縮率
テーブルを備えている。また、再生速度制御部42は、
表3の蓄積率とバッファから音声データを出力する速度
の倍率との関係を記憶した早聞きモード用の蓄積率/再
生速度倍率テーブルを備えている。
The adaptive speech speed controller 8 has a storage ratio / compression ratio table for the fast listening mode in which the relationship between the storage ratio and the compression ratio shown in Table 3 is stored. In addition, the playback speed control unit 42
A storage ratio / reproduction speed magnification table for a fast listening mode is provided which stores the relationship between the storage ratio and the magnification of the speed at which audio data is output from the buffer in Table 3.

【0072】適応話速制御部8は、蓄積率算出部7から
蓄積率が送られてくると、早聞きモード用の蓄積率/圧
縮率テーブルに基づいて、蓄積率算出部7から送られて
きた蓄積率に対応する圧縮率を読み出し、時間軸圧縮伸
長部5に設定する。
When the storage rate is sent from the storage rate calculation section 7, the adaptive speech speed control section 8 is sent from the storage rate calculation section 7 based on the storage rate / compression rate table for the fast listening mode. The compression rate corresponding to the stored accumulation rate is read out and set in the time axis compression / expansion unit 5.

【0073】再生速度制御部42は、蓄積率算出部7か
ら蓄積率が送られてくると、早聞きモード用の蓄積率/
再生速度倍率テーブルに基づいて、蓄積率算出部7から
送られてきた蓄積率に対応する再生速度倍率を読み出
し、バッファ41から音声データの出力速度を、再生速
度倍率に応じた速度となるように制御する。なお、ハー
ドディスク40から音声データを読み出す速度は、バッ
ファ41から音声データを出力する速度に比べて非常に
早く、バッファ41が空になることはない。
When the storage rate is sent from the storage rate calculation section 7, the playback speed control section 42 sets the storage rate /
Based on the reproduction speed magnification table, the reproduction speed magnification corresponding to the accumulation ratio sent from the accumulation ratio calculation unit 7 is read, and the output speed of the audio data from the buffer 41 is set to a speed corresponding to the reproduction speed magnification. Control. Note that the speed at which audio data is read from the hard disk 40 is much faster than the speed at which audio data is output from the buffer 41, and the buffer 41 does not become empty.

【0074】(1) 蓄積率が0〜20%(0以上でか
つ20%未満)である場合 蓄積率が0〜20%である場合には、圧縮率は1に設定
され、再生速度倍率は2倍に設定される。この場合に
は、再生速度制御部42は、標準再生速度(1倍速再生
時の再生速度)の2倍に応じた速度で、バッファ41か
ら音声データを出力させる。
(1) When the accumulation rate is 0 to 20% (0 or more and less than 20%) When the accumulation rate is 0 to 20%, the compression rate is set to 1 and the reproduction speed magnification is It is set to double. In this case, the playback speed control unit 42 causes the buffer 41 to output the audio data at a speed corresponding to twice the standard playback speed (the playback speed at 1 × speed playback).

【0075】バッファ41から出力された音声データ
は、無音区間削除部4によって無音区間のデータが削除
された後、時間軸圧縮伸長部5で時間軸圧縮伸長処理は
行なわれずに、リングメモリ6に蓄積される。リングメ
モリ6に蓄積された音声データは、標準再生速度に応じ
た速度で読み出されて出力される。したがって、出力音
声の話速は、標準再生速度(1倍速再生時の再生速度)
で再生されたときの出力音声の話速と等しくなる。
In the audio data output from the buffer 41, after the data of the silent section is deleted by the silent section deleting section 4, the time axis compressing / expanding section 5 does not perform the time axis compressing / expanding processing, and stores it in the ring memory 6. Stored. The audio data stored in the ring memory 6 is read and output at a speed corresponding to the standard playback speed. Therefore, the speech speed of the output voice is the standard playback speed (playback speed at 1x speed playback).
Becomes the same as the speech speed of the output sound when reproduced in.

【0076】リングメモリ6へのデータ書き込み速度
は、リングメモリ6からのデータ読み出し速度より速い
ので、リングメモリ6内の未読み出しの音声データの蓄
積量が増加していく。未読み出しの音声データの蓄積量
が増加していく速度は、入力音声データに無音区間のデ
ータが少ない程、速くなる。
Since the speed of writing data to the ring memory 6 is faster than the speed of reading data from the ring memory 6, the amount of unread voice data stored in the ring memory 6 increases. The speed at which the storage amount of unread audio data increases increases as the input audio data contains less data in a silent section.

【0077】(2) 蓄積率が20〜40%である場合 蓄積率が20〜40%である場合には、圧縮率が1.2
に設定される。ただし、再生速度倍率は2のままであ
る。この場合には、時間軸圧縮伸長部5は、入力信号の
時間長Pと出力信号の時間長Qとの比が1.2:1とな
るように、入力データに対して時間軸圧縮処理を行な
う。この結果、出力音声の話速は、標準再生速度(1倍
速再生時の再生速度)で再生されたときの出力音声の話
速より若干速くなる。一方、リングメモリ6に入力され
る音声区間の音声データ量が低減されるので、上記
(1)の場合に比べて、リングメモリ6から読み出され
るデータ量に対する、リングメモリ6に書き込まれるデ
ータ量の比を小さくすることができる。
(2) When the accumulation rate is 20 to 40% When the accumulation rate is 20 to 40%, the compression rate is 1.2
Is set to However, the reproduction speed magnification remains at 2. In this case, the time axis compression / expansion unit 5 performs time axis compression processing on the input data so that the ratio of the time length P of the input signal to the time length Q of the output signal becomes 1.2: 1. Do. As a result, the voice speed of the output voice is slightly higher than the voice speed of the output voice when reproduced at the standard reproduction speed (reproduction speed at 1 × speed reproduction). On the other hand, since the amount of voice data in the voice section input to the ring memory 6 is reduced, the amount of data written to the ring memory 6 with respect to the amount of data read from the ring memory 6 is smaller than in the case (1). The ratio can be reduced.

【0078】(3) 蓄積率が40〜60%である場合 蓄積率が40〜60%である場合には、圧縮率が1.4
に設定される。ただし、再生速度倍率は2のままであ
る。この場合には、時間軸圧縮伸長部5は、入力信号の
時間長Pと出力信号の時間長Qとの比が1.4:1とな
るように、入力データに対して時間軸圧縮処理を行な
う。この結果、出力音声の話速は、上記(2)の場合に
比べてさらに速くなる。一方、リングメモリ6に入力さ
れる音声区間の音声データ量が上記(2)の場合に比べ
てさらに低減されるので、上記(2)の場合に比べて、
リングメモリ6から読み出されるデータ量に対する、リ
ングメモリ6に書き込まれるデータ量の比を小さくする
ことができる。
(3) When the accumulation rate is 40 to 60% When the accumulation rate is 40 to 60%, the compression rate is 1.4.
Is set to However, the reproduction speed magnification remains at 2. In this case, the time axis compression / expansion unit 5 performs the time axis compression processing on the input data so that the ratio of the time length P of the input signal to the time length Q of the output signal becomes 1.4: 1. Do. As a result, the speech speed of the output voice is higher than in the case of the above (2). On the other hand, the amount of voice data in the voice section input to the ring memory 6 is further reduced as compared with the case of the above (2).
The ratio of the amount of data written to the ring memory 6 to the amount of data read from the ring memory 6 can be reduced.

【0079】(4) 蓄積率が60〜80%である場合 蓄積率が60〜80%である場合には、圧縮率が1.4
に設定され、再生速度倍率が1.8倍に設定される。こ
の場合には、再生速度制御部42は、標準再生速度の
1.8倍に応じた速度で、バッファ41から音声データ
を出力させる。また、時間軸圧縮伸長部5は、入力信号
の時間長Pと出力信号の時間長Qとの比が1.4:1と
なるように、入力データに対して時間軸圧縮処理を行な
う。
(4) When the accumulation rate is 60 to 80% When the accumulation rate is 60 to 80%, the compression rate is 1.4.
And the reproduction speed magnification is set to 1.8 times. In this case, the playback speed control unit 42 causes the buffer 41 to output audio data at a speed corresponding to 1.8 times the standard playback speed. Further, the time axis compression / expansion unit 5 performs time axis compression processing on the input data so that the ratio of the time length P of the input signal to the time length Q of the output signal becomes 1.4: 1.

【0080】再生速度倍率が1.8に設定されるので、
上記(3)の場合に比べて、リングメモリ6へのデータ
の書き込み速度が低下するため、上記(3)の場合に比
べて、リングメモリ6から読み出されるデータ量に対す
る、リングメモリ6に書き込まれるデータ量の比を小さ
くすることができる。また、再生速度倍率が上記(3)
に比べて小さくされているので、圧縮率のみを大きくす
る場合に比べて、出力音声の話速が早口になりすぎるこ
とがない。即ち、聞き取りが容易な範囲での早口とする
ことができる。
Since the reproduction speed magnification is set to 1.8,
Since the speed of writing data to the ring memory 6 is lower than in the case (3), the data is written to the ring memory 6 with respect to the amount of data read from the ring memory 6 as compared to the case (3). The ratio of the data amount can be reduced. In addition, the reproduction speed magnification is the above (3)
Therefore, the speech speed of the output sound is not too fast compared to the case where only the compression ratio is increased. In other words, it is possible to make the speech as quick as possible in a range that is easy to hear.

【0081】(5) 蓄積率が80〜95%である場合 蓄積率が80〜95%である場合には、圧縮率が1.4
に設定され、再生速度倍率が1.6倍に設定される。こ
の場合には、再生速度制御部42は、標準再生速度の
1.6倍に応じた速度で、バッファ41から音声データ
を出力させる。また、時間軸圧縮伸長部5は、入力信号
の時間長Pと出力信号の時間長Qとの比が1.6:1と
なるように、入力データに対して時間軸圧縮処理を行な
う。
(5) When the accumulation rate is 80 to 95% When the accumulation rate is 80 to 95%, the compression rate is 1.4.
And the reproduction speed magnification is set to 1.6 times. In this case, the playback speed control unit 42 causes the buffer 41 to output audio data at a speed corresponding to 1.6 times the standard playback speed. Further, the time axis compression / expansion unit 5 performs time axis compression processing on the input data such that the ratio of the time length P of the input signal to the time length Q of the output signal becomes 1.6: 1.

【0082】再生速度倍率が1.6に設定されるので、
上記(4)の場合に比べて、リングメモリ6へのデータ
の書き込み速度が低下するため、上記(4)の場合に比
べて、リングメモリ6から読み出されるデータ量に対す
る、リングメモリ6に書き込まれるデータ量の比を小さ
くすることができる。また、再生速度倍率が上記(4)
に比べて小さくされているので、圧縮率のみを大きくす
る場合に比べて、出力音声の話速が早口になりすぎるこ
とがない。即ち、聞き取りが容易な範囲での早口とする
ことができる。
Since the reproduction speed magnification is set to 1.6,
Since the speed of writing data to the ring memory 6 is lower than in the case (4), the data is written to the ring memory 6 with respect to the amount of data read from the ring memory 6 as compared to the case (4). The ratio of the data amount can be reduced. In addition, the reproduction speed magnification is (4)
Therefore, the speech speed of the output sound is not too fast compared to the case where only the compression ratio is increased. In other words, it is possible to make the speech as quick as possible in a range that is easy to hear.

【0083】(6) 蓄積率が95〜100%である場
合 蓄積率が95〜100%である場合には、圧縮率が1.
4に設定され、再生速度倍率が1.4倍に設定される。
この場合には、再生速度制御部42は、標準再生速度の
1.4倍に応じた速度で、バッファ41から音声データ
を出力させる。また、時間軸圧縮伸長部5は、入力信号
の時間長Pと出力信号の時間長Qとの比が1.4:1と
なるように、入力データに対して時間軸圧縮処理を行な
う。
(6) When the accumulation rate is 95 to 100% When the accumulation rate is 95 to 100%, the compression rate is 1.
4, and the reproduction speed magnification is set to 1.4 times.
In this case, the playback speed control unit 42 causes the buffer 41 to output audio data at a speed corresponding to 1.4 times the standard playback speed. Further, the time axis compression / expansion unit 5 performs time axis compression processing on the input data so that the ratio of the time length P of the input signal to the time length Q of the output signal becomes 1.4: 1.

【0084】再生速度倍率が1.4に設定されるので、
上記(5)の場合に比べて、リングメモリ6へのデータ
の書き込み速度が低下するため、上記(5)の場合に比
べて、リングメモリ6から読み出されるデータ量に対す
る、リングメモリ6に書き込まれるデータ量の比を小さ
くすることができる。また、再生速度倍率が上記(5)
に比べて小さくされているので、圧縮率のみを大きくす
る場合に比べて、出力音声の話速が早口になりすぎるこ
とがない。即ち、聞き取りが容易な範囲での早口とする
ことができる。
Since the reproduction speed magnification is set to 1.4,
Since the speed of writing data to the ring memory 6 is lower than in the case (5), the data is written to the ring memory 6 with respect to the amount of data read from the ring memory 6 compared to the case (5). The ratio of the data amount can be reduced. In addition, the reproduction speed magnification is equal to the above (5).
Therefore, the speech speed of the output sound is not too fast compared to the case where only the compression ratio is increased. In other words, it is possible to make the speech as quick as possible in a range that is easy to hear.

【0085】〔3−2〕遅聞きモード時の動作の説明 表4は、遅聞きモード時の、蓄積率と圧縮率との関係お
よび蓄積率とバッファから音声データを出力する速度の
倍率との関係を示している。
[3-2] Description of Operation in Slow Listening Mode Table 4 shows the relationship between the accumulation rate and the compression rate in the slow listening mode and the magnification of the accumulation rate and the speed at which audio data is output from the buffer. Shows the relationship.

【0086】[0086]

【表4】 [Table 4]

【0087】適応話速制御部8は、表4の蓄積率と圧縮
率との関係を記憶した遅聞きモード用の蓄積率/圧縮率
テーブルを備えている。また、再生速度制御部42は、
表4の蓄積率とバッファから音声データを出力する速度
の倍率との関係を記憶した遅聞きモード用の蓄積率/再
生速度倍率テーブルを備えている。
The adaptive speech speed controller 8 has a storage ratio / compression ratio table for the slow listening mode in which the relationship between the storage ratio and the compression ratio shown in Table 4 is stored. In addition, the playback speed control unit 42
There is provided a storage rate / reproduction speed magnification table for the slow listening mode, which stores the relationship between the storage rate and the magnification of the speed at which audio data is output from the buffer in Table 4.

【0088】適応話速制御部8は、蓄積率算出部7から
蓄積率が送られてくると、遅聞きモード用の蓄積率/圧
縮率テーブルに基づいて、蓄積率算出部7から送られて
きた蓄積率に対応する圧縮率を読み出し、時間軸圧縮伸
長部5に設定する。
When the accumulation rate is sent from the accumulation rate calculation section 7, the adaptive speech speed control section 8 is sent from the accumulation rate calculation section 7 based on the accumulation rate / compression rate table for the slow listening mode. The compression rate corresponding to the stored accumulation rate is read out and set in the time axis compression / expansion unit 5.

【0089】再生速度制御部42は、蓄積率算出部7か
ら蓄積率が送られてくると、遅聞きモード用の蓄積率/
再生速度倍率テーブルに基づいて、蓄積率算出部7から
送られてきた蓄積率に対応する再生速度倍率を読み出
し、バッファ41から音声データの出力速度を、再生速
度倍率に応じた速度となるように制御する。
When the storage rate is sent from the storage rate calculation section 7, the playback speed control section 42 stores the storage rate /
Based on the reproduction speed magnification table, the reproduction speed magnification corresponding to the accumulation ratio sent from the accumulation ratio calculation unit 7 is read, and the output speed of the audio data from the buffer 41 is set to a speed corresponding to the reproduction speed magnification. Control.

【0090】(1) 蓄積率が0〜25%である場合 蓄積率が0〜25%である場合には、圧縮率は0.7に
設定され、再生速度倍率は1に設定される。この場合に
は、再生速度制御部42は、標準再生速度に応じた速度
で、バッファ41から音声データを出力させる。
(1) When the accumulation rate is 0 to 25% When the accumulation rate is 0 to 25%, the compression rate is set to 0.7 and the reproduction speed magnification is set to 1. In this case, the playback speed control unit 42 causes the buffer 41 to output audio data at a speed corresponding to the standard playback speed.

【0091】バッファ41から出力された音声データは
無音区間削除部4によって無音区間のデータが削除され
た後、時間軸圧縮伸長部5に送られる。時間軸圧縮伸長
部5では、入力信号の時間長Pと出力信号の時間長Qと
の比が0.7:1となるように、入力データ(音声区間
の音声データ)に対して時間軸伸長処理が行なわれる。
The audio data output from the buffer 41 is sent to the time axis compression / expansion unit 5 after the data of the silent interval is deleted by the silent interval deletion unit 4. The time axis compression / expansion unit 5 performs time axis expansion on the input data (audio data in the audio section) such that the ratio of the time length P of the input signal to the time length Q of the output signal becomes 0.7: 1. Processing is performed.

【0092】時間軸圧縮伸長部5によって時間軸伸長処
理が行なわれた後の音声データは、リングメモリ6に蓄
積される。リングメモリ6に蓄積された音声データは、
標準再生速度に応じた速度で読み出されて出力される。
The audio data after the time axis expansion processing is performed by the time axis compression / expansion unit 5 is stored in the ring memory 6. The voice data stored in the ring memory 6 is
It is read and output at a speed corresponding to the standard playback speed.

【0093】音声区間の音声データは時間軸上で伸長さ
れた後にリングメモリ6に書き込まれているので、出力
音声の話速は標準再生速度で再生されたときの出力音声
の話速より遅くなる。ただし、無音区間の音声データが
少ない程、リングメモリ6内の未読み出しの音声データ
の蓄積量が増加していく。
Since the voice data of the voice section is written in the ring memory 6 after being expanded on the time axis, the voice speed of the output voice is lower than the voice speed of the output voice when reproduced at the standard reproduction speed. . However, the smaller the voice data in the silent section, the larger the storage amount of unread voice data in the ring memory 6.

【0094】(2) 蓄積率が25〜50%である場合 蓄積率が25〜50%である場合には、圧縮率が0.8
に設定される。ただし、再生速度倍率は1のままであ
る。この場合には、時間軸圧縮伸長部5は、入力信号の
時間長Pと出力信号の時間長Qとの比が0.8:1とな
るように、入力データに対して時間軸伸長処理を行な
う。この結果、出力音声の話速は標準再生速度で再生さ
れたときの出力音声の話速より遅いが上記(1)の場合
に比べて若干速くなる。ただし、リングメモリ6に入力
される音声区間の音声データ量が上記(1)の場合に比
べて低減するため、上記(1)の場合に比べて、リング
メモリ6から読み出されるデータ量に対する、リングメ
モリ6に書き込まれるデータ量の比を小さくすることが
できる。
(2) When the accumulation ratio is 25 to 50% When the accumulation ratio is 25 to 50%, the compression ratio is 0.8
Is set to However, the reproduction speed magnification remains at 1. In this case, the time axis compression / expansion unit 5 performs the time axis expansion processing on the input data so that the ratio of the time length P of the input signal to the time length Q of the output signal becomes 0.8: 1. Do. As a result, the voice speed of the output voice is lower than the voice speed of the output voice when reproduced at the standard reproduction speed, but is slightly higher than in the case of the above (1). However, since the voice data amount of the voice section input to the ring memory 6 is reduced as compared with the case of the above (1), the ring data with respect to the data amount read from the ring memory 6 is compared with the case of the above (1). The ratio of the amount of data written to the memory 6 can be reduced.

【0095】(3) 蓄積率が50〜75%である場合 蓄積率が50〜75%である場合には、圧縮率が0.9
に設定され、再生速度倍率が0.9に設定される。この
場合には、再生速度制御部42は、標準再生速度の0.
9倍に応じた速度で、バッファ41から音声データを出
力させる。また、時間軸圧縮伸長部5は、単位時間当た
りのデータ入力個数Pと、単位時間当たりのデータ出力
個数Qとの比が、0.9:1となるように、入力データ
に対して時間軸伸長処理を行なう。
(3) When the accumulation rate is 50 to 75% When the accumulation rate is 50 to 75%, the compression rate is 0.9.
And the reproduction speed magnification is set to 0.9. In this case, the playback speed control unit 42 sets the standard playback speed to 0.
The audio data is output from the buffer 41 at a speed corresponding to nine times. Further, the time axis compression / expansion unit 5 applies a time axis to the input data such that the ratio of the data input number P per unit time to the data output number Q per unit time is 0.9: 1. Perform decompression processing.

【0096】上記(2)の場合に比べて、時間軸上の圧
縮率が大きくされているとともに、再生速度倍率が上記
(2)に比べて小さくされているので、上記(2)の場
合に比べて、リングメモリ6から読み出されるデータ量
に対する、リングメモリ6に書き込まれるデータ量の比
を小さくすることができる。ただし、再生速度倍率が上
記(2)に比べて小さくされているので、圧縮率のみを
大きくする場合に比べて、出力音声の話速は速くならな
い。
As compared with the case of the above (2), the compression rate on the time axis is increased, and the reproduction speed magnification is made smaller than that of the above (2). In comparison, the ratio of the amount of data written to the ring memory 6 to the amount of data read from the ring memory 6 can be reduced. However, since the reproduction speed magnification is smaller than that in the above (2), the speaking speed of the output sound is not faster than when only the compression ratio is increased.

【0097】(4) 蓄積率が75〜100%である場
合 蓄積率が75〜100%である場合には、圧縮率が1.
0に設定され、再生速度倍率が0.8倍に設定される。
再生速度制御部42は、標準再生速度の0.8倍に応じ
た速度で、バッファ41から音声データを出力させる。
また、時間軸圧縮伸長部5は、時間軸伸長処理を行なわ
ない。
(4) When the accumulation rate is 75 to 100% When the accumulation rate is 75 to 100%, the compression rate is 1.
0 is set, and the reproduction speed magnification is set to 0.8 times.
The playback speed control unit 42 causes the buffer 41 to output audio data at a speed corresponding to 0.8 times the standard playback speed.
The time axis compression / expansion unit 5 does not perform the time axis expansion processing.

【0098】上記(3)の場合に比べて、時間軸上の圧
縮率が大きくされているとともに、再生速度倍率が上記
(3)に比べて小さくされているので、上記(3)の場
合に比べて、リングメモリ6から読み出されるデータ量
に対する、リングメモリ6に書き込まれるデータ量の比
を小さくすることができる。ただし、再生速度倍率が上
記(3)に比べて小さくされているので、圧縮率のみを
大きくする場合に比べて、出力音声の話速は速くならな
い。
As compared with the case of the above (3), the compression ratio on the time axis is increased, and the reproduction speed magnification is made smaller than that of the above (3). In comparison, the ratio of the amount of data written to the ring memory 6 to the amount of data read from the ring memory 6 can be reduced. However, since the reproduction speed magnification is smaller than that in the above (3), the speaking speed of the output sound is not faster than when only the compression ratio is increased.

【0099】[0099]

【発明の効果】この発明によれば、音声データ蓄積用メ
モリ内の未読み出しの音声データの蓄積量が増加した場
合でも、出力音声の話速をさほど速くさせることなく、
音声データ蓄積用メモリ内の未読み出しの音声データの
蓄積量が音声データ蓄積用メモリの容量を越えないよう
にすることができるようになる。
According to the present invention, even if the storage amount of unread voice data in the voice data storage memory increases, the speech speed of the output voice does not increase so much.
The amount of unread audio data stored in the audio data storage memory can be prevented from exceeding the capacity of the audio data storage memory.

【図面の簡単な説明】[Brief description of the drawings]

【図1】第1の実施の形態である話速変換装置の構成を
示すブロック図である。
FIG. 1 is a block diagram illustrating a configuration of a speech speed conversion device according to a first embodiment.

【図2】第1の実施の形態の変形例を示すブロック図で
ある。
FIG. 2 is a block diagram showing a modification of the first embodiment.

【図3】第2の実施の形態である話速変換装置の構成を
示すブロック図である。
FIG. 3 is a block diagram illustrating a configuration of a speech speed conversion device according to a second embodiment.

【図4】第3の実施の形態である話速変換装置の構成を
示すブロック図である。
FIG. 4 is a block diagram illustrating a configuration of a speech speed conversion device according to a third embodiment.

【符号の説明】[Explanation of symbols]

1 A/D変換部 2 フレームメモリ 3 区間判定部 4 無音区間削除部 5 時間軸圧縮伸長部 6 リングメモリ 7 蓄積率算出部 8 適応話速制御部 9 D/A変換部 20 VTR 21 再生速度制御部 30 音声再生装置 31 再生速度制御部 40 ハードティスク 41 バッファ 42 再生速度制御部 DESCRIPTION OF SYMBOLS 1 A / D conversion part 2 Frame memory 3 Section judgment part 4 Silence section deletion part 5 Time axis compression / decompression part 6 Ring memory 7 Accumulation rate calculation part 8 Adaptive speech speed control part 9 D / A conversion part 20 VTR 21 Reproduction speed control Unit 30 audio playback device 31 playback speed control unit 40 hard disk 41 buffer 42 playback speed control unit

Claims (7)

【特許請求の範囲】[Claims] 【請求項1】 音声再生装置から入力される入力音声信
号を話速変換処理する話速変換処理手段、話速変換処理
手段の出力が書き込まれる音声データ蓄積用メモリ、お
よび音声データ蓄積用メモリから音声データを読み出す
手段を備えた話速変換装置において、 音声データ蓄積用メモリ内の未読み出しの音声データの
蓄積率を算出する算出手段、および音声データ蓄積用メ
モリ内の未読み出しの音声データの蓄積率に応じて、音
声再生装置の再生速度を制御する制御手段、 を備えていることを特徴とする話速変換装置。
1. A speech speed conversion processing means for speech speed conversion processing of an input speech signal input from a speech reproduction device, a speech data storage memory to which an output of the speech speed conversion means is written, and a speech data storage memory A speech speed conversion device provided with means for reading voice data; a calculating means for calculating a storage rate of unread voice data in a voice data storage memory; and a storage of unread voice data in a voice data storage memory. Control means for controlling the reproduction speed of the audio reproduction device according to the rate.
【請求項2】 話速変換処理手段は、入力音声信号が音
声区間であるか無音区間であるかを判定する区間判定手
段、 無音区間であると判定された入力音声信号を削除処理す
る削除処理手段、および有音区間であると判定された入
力音声信号を、音声データ蓄積用メモリ内の未読み出し
の音声データの蓄積率に応じた圧縮率で時間軸圧縮伸長
処理する時間軸圧縮伸長処理手段、 を備えている請求項1に記載の話速変換装置。
2. The speech speed conversion processing means includes: a section determining means for determining whether an input voice signal is a voice section or a silent section; and a deleting process for deleting an input voice signal determined to be a silent section. And a time axis compression / expansion processing means for performing time axis compression / expansion processing on an input audio signal determined to be a voiced section at a compression rate corresponding to a storage rate of unread audio data in an audio data storage memory. The speech speed conversion device according to claim 1, comprising:
【請求項3】 音声再生装置がVTRである請求項1お
よび2のいずれかに記載の話速変換装置。
3. The speech speed conversion device according to claim 1, wherein the voice reproduction device is a VTR.
【請求項4】 音声再生装置がハードディスクレコーダ
である請求項1および2のいずれかに記載の話速変換装
置。
4. The speech speed conversion device according to claim 1, wherein the audio reproduction device is a hard disk recorder.
【請求項5】 音声再生装置から入力されるアナログ音
声信号を設定された再生速度倍率に応じたサンプリング
周波数でサンプリングするA/D変換手段、A/D変換
手段から出力される音声データが入力されるフレームメ
モリ、フレームメモリに所要数の音声データが入力され
る毎に、それらの音声データに対して話速変換処理を行
なう話速変換処理手段、話速変換処理手段の出力が書き
込まれる音声データ蓄積用メモリ、および音声データ蓄
積用メモリから音声データを読み出す手段を備えた話速
変換装置において、 音声データ蓄積用メモリ内の未読み出しの音声データの
蓄積率を算出する算出手段、および音声データ蓄積用メ
モリ内の未読み出しの音声データの蓄積率に応じて、音
声再生装置の再生速度を制御する制御手段、 を備えていることを特徴とする話速変換装置。
5. An A / D converter for sampling an analog audio signal input from an audio reproducer at a sampling frequency corresponding to a set reproduction speed magnification, and audio data output from the A / D converter are input. A frame memory, a speech rate conversion processing means for performing speech rate conversion processing on the speech data each time a required number of speech data are input to the frame memory, and speech data to which the output of the speech rate conversion processing means is written. A speech speed conversion device comprising a storage memory and a means for reading voice data from the voice data storage memory, a calculating means for calculating a storage rate of unread voice data in the voice data storage memory, and a voice data storage Control means for controlling the playback speed of the audio playback device according to the accumulation rate of unread audio data in the memory for Speech speed conversion apparatus according to claim Rukoto.
【請求項6】 音声再生装置から入力されるデジタル音
声信号が、設定された再生速度倍率に応じた速度で書き
込まれるフレームメモリ、フレームメモリに所要数の音
声データが入力される毎に、それらの音声データに対し
て話速変換処理を行なう話速変換処理手段、話速変換処
理手段の出力が書き込まれる音声データ蓄積用メモリ、
および音声データ蓄積用メモリから音声データを読み出
す手段を備えた話速変換装置において、 音声データ蓄積用メモリ内の未読み出しの音声データの
蓄積率を算出する算出手段、および音声データ蓄積用メ
モリ内の未読み出しの音声データの蓄積率に応じて、音
声再生装置の再生速度を制御する制御手段、 を備えていることを特徴とする話速変換装置。
6. A frame memory in which a digital audio signal input from an audio reproducing device is written at a speed corresponding to a set reproduction speed magnification, and each time a required number of audio data are input to the frame memory, the digital audio signal is input to the frame memory. Voice speed conversion processing means for performing voice speed conversion processing on voice data, voice data storage memory into which the output of voice speed conversion processing means is written,
And a speech speed conversion device provided with means for reading voice data from the voice data storage memory, comprising: a calculating means for calculating a storage rate of unread voice data in the voice data storage memory; Control means for controlling the reproduction speed of the audio reproduction device according to the accumulation rate of unread audio data.
【請求項7】 話速変換処理手段は、 フレームメモリに入力された所要数の音声データに対応
する入力音声が音声区間であるか無音区間であるかを判
定する区間判定手段、 無音区間であると判定された音声データを削除処理する
削除処理手段、および有音区間であると判定された音声
データを、音声データ蓄積用メモリ内の未読み出しの音
声データの蓄積率に応じた圧縮率で時間軸圧縮伸長処理
する時間軸圧縮伸長処理手段、 を備えている請求項5
および6のいずれかに記載の話速変換装置。
7. Speech rate conversion processing means includes: a section determination means for determining whether an input voice corresponding to a required number of voice data input to the frame memory is a voice section or a silent section; Deletion processing means for deleting the voice data determined to be a voice section, and processing the voice data determined to be a sound section at a compression rate corresponding to the storage rate of the unread voice data in the voice data storage memory. 6. A time axis compression / expansion processing means for performing axis compression / expansion processing.
The speech speed conversion device according to any one of claims 6 and 7.
JP2001014067A 2000-02-28 2001-01-23 Speech speed converter Pending JP2001318700A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001014067A JP2001318700A (en) 2000-02-28 2001-01-23 Speech speed converter

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2000-51305 2000-02-28
JP2000051305 2000-02-28
JP2001014067A JP2001318700A (en) 2000-02-28 2001-01-23 Speech speed converter

Publications (1)

Publication Number Publication Date
JP2001318700A true JP2001318700A (en) 2001-11-16

Family

ID=26586224

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001014067A Pending JP2001318700A (en) 2000-02-28 2001-01-23 Speech speed converter

Country Status (1)

Country Link
JP (1) JP2001318700A (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006014150A (en) * 2004-06-29 2006-01-12 Matsushita Electric Ind Co Ltd Terminal, network camera, program, and network system
WO2006008810A1 (en) * 2004-07-21 2006-01-26 Fujitsu Limited Speed converter, speed converting method and program
JP2008107381A (en) * 2006-10-23 2008-05-08 Mitsubishi Electric Corp Speaking speed converting device and speaking speed converting control method

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006014150A (en) * 2004-06-29 2006-01-12 Matsushita Electric Ind Co Ltd Terminal, network camera, program, and network system
WO2006008810A1 (en) * 2004-07-21 2006-01-26 Fujitsu Limited Speed converter, speed converting method and program
US7672840B2 (en) 2004-07-21 2010-03-02 Fujitsu Limited Voice speed control apparatus
JP2008107381A (en) * 2006-10-23 2008-05-08 Mitsubishi Electric Corp Speaking speed converting device and speaking speed converting control method

Similar Documents

Publication Publication Date Title
US7149412B2 (en) Trick mode audio playback
JP3630609B2 (en) Audio information reproducing method and apparatus
JPH11202900A (en) Voice data compressing method and voice data compression system applied with same
JP2001318700A (en) Speech speed converter
JP3162945B2 (en) Video tape recorder
KR20010085664A (en) Speech speed converting device
JP3081469B2 (en) Speech speed converter
JP3357742B2 (en) Speech speed converter
JP3189587B2 (en) Audio time base converter
JPH09152889A (en) Speech speed transformer
JP2000099097A (en) Signal reproducing device and method, voice signal reproducing device, and speed conversion method for voice signal
JPH0916200A (en) Voice recording and reproducing device
JP2001222300A (en) Voice reproducing device and recording medium
JPH08211894A (en) Voice-grade communication equipment and voice-grade communication system
JP3189597B2 (en) Audio time base converter
JPH08328586A (en) Phonetic time axis conversion device
JP4529859B2 (en) Audio playback device
JP2874607B2 (en) Audio time base converter
JPH0573089A (en) Speech reproducing method
JPH08214058A (en) Recorder for telephone set
JP3316344B2 (en) Audio signal playback device
JPH09146587A (en) Speech speed changer
JPH08292796A (en) Reproducing device
KR0166885B1 (en) Automatic answering phone voice message compression controller
JPH09154093A (en) Video/audio reproducing device

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040811

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20060920

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20061004

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20070214