JP3189587B2 - Audio time base converter - Google Patents

Audio time base converter

Info

Publication number
JP3189587B2
JP3189587B2 JP22013194A JP22013194A JP3189587B2 JP 3189587 B2 JP3189587 B2 JP 3189587B2 JP 22013194 A JP22013194 A JP 22013194A JP 22013194 A JP22013194 A JP 22013194A JP 3189587 B2 JP3189587 B2 JP 3189587B2
Authority
JP
Japan
Prior art keywords
speed
data
control unit
memory
sound
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP22013194A
Other languages
Japanese (ja)
Other versions
JPH0883096A (en
Inventor
武志 則松
正之 三崎
公治 渡辺
憲和 上野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Priority to JP22013194A priority Critical patent/JP3189587B2/en
Priority to EP95306302A priority patent/EP0702354A1/en
Priority to CN 95117716 priority patent/CN1131794A/en
Publication of JPH0883096A publication Critical patent/JPH0883096A/en
Application granted granted Critical
Publication of JP3189587B2 publication Critical patent/JP3189587B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【産業上の利用分野】本発明は、ビデオテープレコーダ
ー(VTR)等で音声の高速、低速再生を行う際に必要
となる音声の時間軸の長さを任意に圧縮、伸長すること
のできる音声時間軸変換装置に関するものである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an audio system capable of arbitrarily compressing and expanding the length of the audio time axis required for high-speed and low-speed audio reproduction by a video tape recorder (VTR) or the like. The present invention relates to a time axis conversion device.

【0002】[0002]

【従来の技術】従来から、記録媒体から記録時とは異な
った速度で音声信号を再生することのできる音声時間軸
変換装置がある。例えばカセットテープレコーダーの早
送り再生機能であるが、この場合読みだし速度を高速に
することにより音程までもが変化してしまうため、大変
聴きづらいものとなる。そこで、音程は記録時のままで
再生速度を可変することのできる音声時間軸変換装置が
提案されている。
2. Description of the Related Art Conventionally, there is an audio time base conversion apparatus capable of reproducing an audio signal from a recording medium at a speed different from that at the time of recording. For example, a fast-forward playback function of a cassette tape recorder is very difficult to listen to, because in this case, even if the reading speed is increased, even the pitch is changed. Therefore, there has been proposed an audio time base conversion apparatus capable of changing the reproduction speed while keeping the pitch at the time of recording.

【0003】以下、従来の音声時間軸変換装置について
図面を参照しながら説明する。図7は従来の音声時間軸
変換装置の構成を示すブロック図である。図7におい
て、1は音響信号の記録及び再生を行う記録再生部、2
は再生されたアナログ信号をディジタル信号に変換する
A/D変換器、3はディジタルデータを蓄積するための
バッファメモリー、4はD/A変換器、5はバッファメ
モリーへのデータの書き込みを制御する書き込み制御
部、6はメモリのデータの読み出しを制御する読みだし
制御部である。
[0003] A conventional audio time base converter will be described below with reference to the drawings. FIG. 7 is a block diagram showing a configuration of a conventional audio time base conversion apparatus. 7, reference numeral 1 denotes a recording / reproducing unit for recording and reproducing an audio signal;
Is an A / D converter for converting a reproduced analog signal into a digital signal, 3 is a buffer memory for storing digital data, 4 is a D / A converter, and 5 is a controller for writing data to the buffer memory. The writing control unit 6 is a reading control unit that controls reading of data from the memory.

【0004】以上のように構成された音声時間軸変換装
置について、以下その動作を説明する。ここでは、記録
媒体への記録速度以上で音声信号を再生する場合に、音
程を記録時のものに戻して再生する音声時間軸変換装置
について説明する。
[0004] The operation of the audio time base conversion apparatus configured as described above will be described below. Here, a description will be given of an audio time base conversion apparatus that reproduces an audio signal at a recording speed that is higher than the recording speed, and reproduces the sound by returning the pitch to that at the time of recording.

【0005】まず、記録再生部1は記録速度のM倍で音
響信号を再生する。ここで記録再生部とは例えば、VT
R、カセットテープレコーダー等である。次に、記録再
生部1から再生された音響信号は再生速度に反比例した
サンプリング周期T/MでA/D変換器2によりディジ
タル信号に変換される。Tは記録時の音響信号について
標本化定理を満足するサンプリング周期であり、M倍速
再生された音響信号をディジタル信号に変換するために
は、少なくともサンプリング周期Tの1/M倍、すなわ
ちT/Mで標本化する必要がある。A/D変換されたこ
れらのディジタル信号は書き込み制御部5により周期T
/Mで順次バッファメモリー3に蓄積される。これらの
信号を今度は周期Tで読み出し再生すれば記録時の音程
に戻るわけであるが、全てのデータを出力するには時間
的に不可能である。そこで読み出し制御部6ではバッフ
ァメモリー3に蓄積されたディジタル信号を周期Tで順
次読みだし、一定量のサンプル値毎に|1−M|/Mの
割合でデータを廃棄しながら、残りのデータをD/A変
換器4によりサンプリング周期Tでアナログ信号に変換
する。ここで||は絶対値を表す。通常この廃棄と再生
の間隔は数ミリ秒以下の短い単位である。これら一連の
処理により、記録時の音程を保持したままで高速再生が
実現できる。
First, the recording / reproducing unit 1 reproduces an audio signal at M times the recording speed. Here, the recording / reproducing unit is, for example, VT
R, cassette tape recorder, and the like. Next, the audio signal reproduced from the recording / reproduction unit 1 is converted into a digital signal by the A / D converter 2 at a sampling period T / M inversely proportional to the reproduction speed. T is a sampling period that satisfies the sampling theorem for an audio signal at the time of recording. In order to convert an audio signal reproduced at M-speed into a digital signal, at least 1 / M times the sampling period T, that is, T / M Must be sampled at The A / D-converted digital signals have a period T
/ M are sequentially stored in the buffer memory 3. If these signals are read out and reproduced in a cycle T, they return to the pitch at the time of recording. However, it is impossible in terms of time to output all data. Therefore, the read control unit 6 sequentially reads the digital signals stored in the buffer memory 3 at a period T and discards the remaining data at a rate of | 1-M | / M for each fixed amount of sample values, The signal is converted into an analog signal by the D / A converter 4 at a sampling period T. Here, || represents an absolute value. Usually, the interval between discarding and regeneration is a short unit of several milliseconds or less. Through a series of these processes, high-speed reproduction can be realized while maintaining the pitch at the time of recording.

【0006】図8は2倍速(M=2)の場合の処理例を
示している。(a)は記録時のデータを示しており、2
倍速で読み出すことにより(b)のように時間軸は1/
2になる。この(b)のデータの1/2を廃棄しながら
サンプリング周期Tで再生すると(c)のデータ列とな
り、音程は(a)のデータ列と同じで、時間軸は(b)
のデータ列と同じにすることができる。
FIG. 8 shows an example of processing at a double speed (M = 2). (A) shows data at the time of recording.
By reading at double speed, the time axis becomes 1 / as shown in (b).
It becomes 2. Reproduction at the sampling period T while discarding 1/2 of the data of (b) results in the data sequence of (c), the pitch is the same as the data sequence of (a), and the time axis is (b)
Can be the same as the data string.

【0007】[0007]

【発明が解決しようとする課題】しかしながら上記した
従来例では、音程は記録時の高さに戻るが、均一の再生
速度の制御しか行えないため、音声の速度は再生速度に
比例して早口になり人間にとって大変聴きづらいものと
なっていた。また、高速再生時に再生速度との時間軸を
そろえるためには、再生速度に比例した量のデータを廃
棄しなければならない。例えば2倍速再生時には半分の
データを棄却することになる。そのため高速になるほど
再生音声は劣化してしまう。また、情報の廃棄の間隔を
数秒程度と長くすれば、音声の再生されている区間は、
劣化もなく記録時と同じ速度で聴き易くなるが、反面大
きなブロックで情報が欠落することになり言葉全体とし
ての意味を理解しづらくなるという欠点があった。
In the above-mentioned prior art, however, the pitch returns to the pitch at the time of recording, but since only a uniform reproduction speed can be controlled, the speed of the sound becomes faster in proportion to the reproduction speed. It was very difficult for humans to hear. Also, in order to align the time axis with the playback speed during high-speed playback, an amount of data proportional to the playback speed must be discarded. For example, at the time of double speed reproduction, half of the data is rejected. Therefore, the higher the speed, the more the reproduced sound deteriorates. If the interval of discarding information is increased to several seconds,
Although it is easy to listen at the same speed as at the time of recording without deterioration, there is a disadvantage that information is lost in a large block, and it is difficult to understand the meaning of the word as a whole.

【0008】本発明は上記課題を解決するもので、記録
媒体から記録速度以上の再生速度で読みだした場合に、
情報の欠落をできるだけ抑えながら聴き易い変換速度に
自動的に変更することが可能な音声時間軸変換装置を提
供することを目的とする。
[0008] The present invention solves the above-mentioned problems, and when reading from a recording medium at a reproduction speed higher than the recording speed,
It is an object of the present invention to provide an audio time base conversion apparatus capable of automatically changing the conversion speed to an easy-to-listen conversion speed while minimizing the loss of information.

【0009】[0009]

【課題を解決するための手段】上記課題を解決するため
に、請求項1記載の音声時間軸変換装置は、記録媒体か
ら記録速度以上の再生速度で音響信号を読み出す記録再
生部と、再生されたアナログ信号をディジタル信号に変
換するA/D変換器と、入力信号中の無音部と有音部の
判定を行う有音無音判定部と、入力信号を蓄積するため
のバッファメモリーと、バッファメモリーへのデータの
書き込み、及びそのアドレスを制御する書き込み制御部
と、バッファメモリーからのデータの読み出し、及びそ
のアドレスを制御する読み出し制御部と、書き込み制御
部及び読み出し制御部で現在の書き込みアドレス及び読
み出しアドレスの位置関係からバッファメモリー中のメ
モリー残量を計測するメモリー残量監視部と、メモリー
残量に応じて予め定めた規則に基づき時間軸変換の速度
を決定する適応速度制御部と、適応速度制御部で決定さ
れた変換速度に従って音声時間軸の圧縮を行う時間軸制
御部と、時間軸変換後のデータをアナログ信号に変換す
るD/A変換器とを備えたものである。
According to a first aspect of the present invention, there is provided an audio time base converting apparatus for reading an audio signal from a recording medium at a reproduction speed higher than a recording speed, and a reproducing unit for reproducing the audio signal. A / D converter for converting an analog signal into a digital signal, a sound / silence determining unit for determining a silent part and a sound part in the input signal, a buffer memory for storing the input signal, and a buffer memory A write control unit that controls writing of data to and from the buffer, a read control unit that controls reading of data from the buffer memory, and a read control unit that controls the address, and a current writing address and reading by the writing control unit and the reading control unit. A memory remaining amount monitoring unit that measures the remaining amount of memory in the buffer memory from the address location An adaptive speed control unit that determines the speed of the time axis conversion based on the rules described above, a time axis control unit that compresses the audio time axis according to the conversion speed determined by the adaptive speed control unit, and And a D / A converter for converting into an analog signal.

【0010】請求項2記載の音声時間軸変換装置は、メ
モリー残量に比例して時間軸変換速度を決定する適応速
度制御部を備えたものである。
According to a second aspect of the present invention, there is provided an audio time base conversion device including an adaptive speed control unit for determining a time base conversion speed in proportion to the remaining memory capacity.

【0011】請求項3記載の音声時間軸変換装置は、メ
モリー残量に非線形に対応した変換規則に基づき時間軸
変換速度を決定する適応速度制御部を備えたものであ
る。
According to a third aspect of the present invention, there is provided an audio time base conversion apparatus including an adaptive speed control unit for determining a time base conversion speed based on a conversion rule nonlinearly corresponding to the remaining memory capacity.

【0012】請求項4記載の音声時間軸変換装置は、隣
合う一定個数のサンプル値列に、それぞれ、単調減少す
る重み係数を掛け合わせた値と、単調増加する重み係数
を掛け合わせた値とを加算するクロスフェード区間と、
サンプル値を直接出力する無処理区間の長さとを調整す
ることにより、所望の時間軸変換速度に変換する時間軸
制御部を備えたものである。
According to a fourth aspect of the present invention, there is provided an audio time axis conversion apparatus, wherein a value obtained by multiplying a fixed number of adjacent sample value sequences by a monotonically decreasing weighting factor and a value obtained by multiplying a monotonically increasing weighting factor are respectively used. And a crossfade section to add
A time axis control unit is provided for converting the length of the non-processing section for directly outputting the sample value to a desired time axis conversion speed by adjusting the length.

【0013】請求項5および請求項6記載の音声時間軸
変換装置は、メモリー残量が一定値以上の時は有音区間
のみをバッファメモリーに蓄積し、一定値以下の時は全
てのデータをバッファメモリーに蓄積する書き込み制御
部を備えたものである。
According to a fifth aspect of the present invention, when the remaining memory capacity is equal to or more than a certain value, only the sound interval is stored in the buffer memory, and when the remaining memory capacity is less than a certain value, all data is stored. It is provided with a write control unit that accumulates in a buffer memory.

【0014】[0014]

【作用】上記請求項1記載の構成によれば、有音無音の
判定の結果、有音と判定された区間のみをバッファメモ
リーに蓄積し、書き込みと読み出しのアドレス位置から
メモリー残量を計測し、その残量に応じて残量の多いと
きはできるだけ低速に残量が少なくなるにつれて徐々に
高速になるといったように無音の量に応じて自動的に速
度を調整できるように構成したことにより、特に無音の
多い入力信号に対しては聴き易い速度で音声を再生する
ことが可能となる。また無音の少ない入力信号の場合
は、メモリー残量に応じて再生速度が変化するので情報
が欠落を防止することができる。また多少の情報の欠落
を許して、適応的に変える音声の速度の最大値を再生速
度より小さい値に設定すると、わずかな情報欠落はある
ものの言葉としては理解できる範囲で聞き取り易い速度
で音声を再生することが可能となる。また記録速度と同
速度(1倍速)で再生する場合に、無音の量に応じて時
間軸変換の速度を記録速度より低速になるように制御す
れば、もともと早口の音声の聞き取り、外国語の聞き取
りを容易にすることも可能となる。。
According to the first aspect of the present invention, only the section determined to be sound is stored in the buffer memory as a result of the sound / silence determination, and the remaining memory is measured from the write and read address positions. , The speed can be automatically adjusted according to the amount of silence, such that when the remaining amount is large, the speed becomes low as much as possible, and as the remaining amount decreases, the speed gradually increases. In particular, it becomes possible to reproduce sound at an easy-to-listen speed for an input signal having a lot of silence. In the case of an input signal with little silence, the reproduction speed changes according to the remaining amount of memory, so that loss of information can be prevented. Also, if some information loss is allowed and the maximum value of the speed of the sound that is adaptively changed is set to a value smaller than the playback speed, the voice can be heard at a speed that is easy to hear as far as it can be understood as words although there is slight information loss. It becomes possible to reproduce. Also, when playing back at the same speed as the recording speed (1x speed), if the time axis conversion speed is controlled to be lower than the recording speed in accordance with the amount of silence, it is possible to hear the voice of the fast-talking voice and Listening can be facilitated. .

【0015】請求項2記載の構成によれば、メモリー残
量と変換速度が比例して変化するので、音声の速度が急
激に変化することが抑えられ、音声が聞き取り易くな
る。
According to the configuration of the second aspect, since the remaining memory capacity and the conversion speed change in proportion to each other, a rapid change in the voice speed is suppressed, and the voice becomes easy to hear.

【0016】請求項3記載の構成によれば、低速の変換
速度に長くとどまるような非線形の変換規則を設定すれ
ば、変換速度を低く抑えようとする効果により、低速側
で安定して音声を再生することが可能であり、非常に聞
き取り易い音声時間軸変換装置が実現できる。
According to the third aspect of the present invention, if a non-linear conversion rule is set so as to stay at a low conversion speed for a long time, the effect of suppressing the conversion speed to a low level enables stable voice output at a low speed. It is possible to realize a sound time axis conversion device that can reproduce and is very easy to hear.

【0017】請求項4記載の構成によれば、バッファメ
モリーに蓄積されたデータを直接出力する無処理区間の
長さを調節するだけで、任意の時間軸変換速度を得るこ
とができ、非常に簡単な構成で任意の速度に変換可能な
音声時間軸変換装置が実現できる。
According to the fourth aspect of the present invention, an arbitrary time base conversion speed can be obtained only by adjusting the length of the non-processing section for directly outputting the data stored in the buffer memory. An audio time axis conversion device capable of converting to an arbitrary speed with a simple configuration can be realized.

【0018】請求項5および請求項6記載の構成によれ
ば、メモリー残量が少なくなった時点で入力信号の有音
無音判定結果にかかわらず全てのデータをバッファメモ
リーに蓄積することにより、読み出すべきデータがなく
なり途中で再生音が無音状態となる(ミュート状態とな
る)ことがなく、違和感のない自然な再生音を得ること
ができる。
According to the fifth and sixth aspects of the present invention, when the remaining memory capacity is low, all data is read out by accumulating in the buffer memory irrespective of the sound / no-sound judgment result of the input signal. It is possible to obtain a natural reproduced sound without a sense of incongruity, because there is no data to be lost and the reproduced sound does not enter a mute state (mute state) on the way.

【0019】[0019]

【実施例】以下、本発明の第1の実施例について図面を
参照しながら説明する。図1は本発明の第1の実施例に
おける音声時間軸変換装置の構成を示すブロック図であ
る。図1において、101は音響信号の記録及び再生を
行う記録再生部、102は記録再生部1で再生されたア
ナログ信号をディジタル信号に変換するA/D変換器、
103は変換されたディジタル信号列が有音部であるか
無音部であるかを判定する有音無音判定部、104は有
音部と判定された信号列を書き込むバッファメモリー1
05上への書き込み及びそのアドレスを制御する書き込
み制御部、106はバッファメモリー105に蓄積され
たデータの読み出し及びそのアドレスを制御する読み出
し制御部、107は現在のバッファメモリー105上の
書き込みアドレスと読み出しアドレスの位置関係からメ
モリー残量を計測するメモリー残量監視部、108はメ
モリー残量監視部で得られたメモリー残量から時間軸変
換のための速度を決定する適応速度制御部、109は適
応速度制御部で決定された変換速度に従って時間軸の変
換処理を行う時間軸制御部、110は時間軸変換された
ディジタルデータをアナログ信号に変換するD/A変換
器である。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS A first embodiment of the present invention will be described below with reference to the drawings. FIG. 1 is a block diagram showing the configuration of the audio time axis conversion device according to the first embodiment of the present invention. In FIG. 1, 101 is a recording / reproducing unit that records and reproduces an audio signal, 102 is an A / D converter that converts an analog signal reproduced by the recording / reproducing unit 1 into a digital signal,
Reference numeral 103 denotes a sound / non-speech determining unit that determines whether the converted digital signal sequence is a sound part or a soundless part. 104 denotes a buffer memory 1 for writing the signal sequence determined to be a sound part.
05 is a write control unit for controlling writing on the address and its address, 106 is a read control unit for reading data stored in the buffer memory 105 and controlling its address, and 107 is a current write address and read on the buffer memory 105. A memory remaining amount monitoring unit that measures the remaining amount of memory from the positional relationship between addresses, an adaptive speed control unit that determines a speed for time axis conversion from the remaining amount of memory obtained by the remaining memory amount monitoring unit, and 109 is an adaptive speed controlling unit. A time axis control unit 110 that performs a time axis conversion process according to the conversion speed determined by the speed control unit, and a D / A converter 110 that converts the time axis converted digital data into an analog signal.

【0020】以上のように構成された音声時間軸変換装
置について、以下その動作を図1を参照しながら詳細に
説明する。
The operation of the audio time base conversion device configured as described above will be described in detail below with reference to FIG.

【0021】まず記録再生部101から記録時のM(≧
1)倍の速度で音響信号が読み出される。以降では、速
度とは記録速度(=1)に対する相対速度を表すことと
する。ここで、記録再生部101での記録時のサンプリ
ング周期をTとすると、記録再生部101よりM倍速で
再生された音響信号は逐次A/D変換器102によりサ
ンプリング周期T/Mでディジタル信号系列に変換され
る。このディジタル信号系列から有音無音判定部103
によりそのサンプル列が有音部であるか無音部であるか
を判定する。有音無音の判定は例えば次のように行う。
ディジタル信号のサンプル値列をsiとすると、N個のサ
ンプル値系列に対して、(数1)を満たす場合にそのサ
ンプル値列は有音、満たさない場合は無音であると判定
する。ここでPthは予め定めた有音無音判定のためのし
きい値である。
First, M (≧≧) at the time of recording from the recording / reproducing unit 101
1) An acoustic signal is read at twice the speed. Hereinafter, the speed indicates a relative speed with respect to the recording speed (= 1). Here, assuming that the sampling period at the time of recording in the recording / reproducing unit 101 is T, the acoustic signal reproduced by the recording / reproducing unit 101 at the M-times speed is sequentially converted into a digital signal sequence by the A / D converter 102 at the sampling period T / M. Is converted to Based on this digital signal sequence, a sound / non-speech determination unit 103
To determine whether the sample sequence is a sound part or a silent part. The determination of presence or absence of sound is performed, for example, as follows.
Assuming that the sample value sequence of the digital signal is s i , it is determined that the sample value sequence is sound if the expression (1) is satisfied for the N sample value sequences, and is silent if the expression is not satisfied. Here, P th is a predetermined threshold value for sound / silence determination.

【0022】[0022]

【数1】 (Equation 1)

【0023】ここで、バッファメモリー105上の次に
データを格納すべきアドレスを指し示すポインター(以
下、書き込みポインターと呼ぶ)をPwとすると、上記
(数1)で有音と判定された場合には、書き込み制御部
104によりそのサンプル値系列が書き込みポインター
Pwの示すバッファメモリー105のアドレス位置に順次
格納され、その都度Pwはインクリメントされる。逆に無
音と判定された場合には、書き込み制御部104はバッ
ファメモリー105へのデータの書き込み動作を停止す
る。これにより、バッファメモリー105には有音部の
データのみが蓄積される。
Here, assuming that a pointer (hereinafter referred to as a write pointer) pointing to an address in the buffer memory 105 at which data is to be stored next is Pw, if it is determined that there is sound in the above (Equation 1), , The sample value sequence is written by the write control unit 104 to the write pointer.
Pw is sequentially stored at an address position of the buffer memory 105 indicated by Pw, and Pw is incremented each time. Conversely, when it is determined that there is no sound, the write control unit 104 stops the operation of writing data to the buffer memory 105. As a result, only the data of the sound part is accumulated in the buffer memory 105.

【0024】なお、ここでは(数1)を満たす場合に有
音、満たさない場合に無音と判定したが、(数1)を満
たす区間に対してその前方、あるいは後方に続く無音と
判定された短いサンプル列分を有音区間に含めてもよ
い。
In this case, it is determined that there is sound when (Equation 1) is satisfied, and it is determined that there is no sound when it is not satisfied. A short sample string may be included in the sound interval.

【0025】読み出し制御部106では、バッファメモ
リー105のデータを周期Tで順次読み出し、時間軸制
御部109へ送る。ここで、次に読み出すべきバッファ
メモリー105上のデータのアドレスを示すポインター
(以下、読み出しポインターと呼ぶ)をPrとする。メモ
リー残量監視部107では、前記書き込みポインターPw
と読み出しポインターPrとの位置関係から、バッファメ
モリー105上のまだ読み出されていないデータの残量
を逐次計測する。図2はメモリー残量の計測方法を示す
説明図であり、2つのポインターの位置関係により同図
(a)(b)の2つの場合がある。図2においてバッフ
ァメモリーの開始アドレスをa0、終了アドレスをa
nー1(但し、anー1>a0)とすると、まだ読み出されてい
ないメモリー残量Zは、図2の斜線の部分で示され次式
のように計算できる。
The read control unit 106 sequentially reads data from the buffer memory 105 at a period T and sends the data to the time axis control unit 109. Here, a pointer indicating the address of the data on the buffer memory 105 to be read next (hereinafter, referred to as a read pointer) is denoted by Pr. In the memory remaining amount monitoring unit 107, the write pointer Pw
The remaining amount of data that has not yet been read on the buffer memory 105 is sequentially measured from the positional relationship between the data and the read pointer Pr. FIG. 2 is an explanatory diagram showing a method of measuring the remaining amount of memory. There are two cases shown in FIGS. 2A and 2B depending on the positional relationship between two pointers. In FIG. 2, the start address of the buffer memory is a 0 and the end address is a
Assuming that n−1 (where a n−1 > a 0 ), the remaining memory capacity Z that has not been read out is indicated by the hatched portion in FIG. 2 and can be calculated as in the following equation.

【0026】[0026]

【数2】 (Equation 2)

【0027】これは、バッファメモリー105をいわゆ
る巡回メモリーとして扱っていることと等価である。こ
こで、通常メモリーからデータを読みだし出力するため
には、巡回メモリー上で書き込みポインターPwが読み出
しポインターPrより先行していなければならないため、
PwとPrが重なっている場合は(Pw=Pr)、読み出し制御
部106が読み出し動作を停止し、読み出しポインター
Prはそのときのアドレス値を維持する。ここで、PwとPr
が重なった状態には、図2(a)でPrがPwに追いついた
場合と、図2(b)でPwがPrに追いついた場合の2通り
が考えられる。後者の場合は、実際にはメモリー残量が
バッファメモリー105の容量、即ちnの時に相当する
が、この場合もメモリー残量Zを0にリセットする。
This is equivalent to treating the buffer memory 105 as a so-called cyclic memory. Here, in order to read and output data from the normal memory, the write pointer Pw must precede the read pointer Pr on the cyclic memory,
When Pw and Pr overlap (Pw = Pr), the read control unit 106 stops the read operation and the read pointer
Pr maintains the address value at that time. Where Pw and Pr
2 can be considered as two cases, that is, when Pr catches up with Pw in FIG. 2A and when Pw catches up with Pr in FIG. 2B. In the latter case, the remaining memory capacity actually corresponds to the capacity of the buffer memory 105, that is, n, but also in this case, the remaining memory capacity Z is reset to zero.

【0028】メモリー残量監視部107で得られたメモ
リー残量Zの値をもとに、適応速度制御部108では、
メモリー残量が少ないときはできるだけ記録速度に近い
ゆっくりした速度に、残量が多いときには書き込みポイ
ンターPwに読み出しポインターPrが追いつかれないよう
に、適宜速い速度に時間軸変換の速度を設定する。以下
適応速度制御部108の動作を、記録再生部101から
記録速度の2倍(M=2)の速度で再生した場合につい
て説明する。ここでは、変換速度の最大値を再生速度と
同じ2、最小値を記録速度と同じ1とする。図3はメモ
リー残量とそれに対する変換速度の関係を示しており、
これが変換速度を設定するための規則となる。図3
(a)はメモリー残量と変換速度を線形に対応づける規
則を示している。この場合、変換速度Vは次式により算
出できる。
On the basis of the value of the memory remaining amount Z obtained by the memory remaining amount monitoring unit 107, the adaptive speed control unit 108
When the remaining memory capacity is small, the speed of the time axis conversion is set to a slow speed as close as possible to the recording speed, and when the remaining capacity is large, the time axis conversion speed is set to an appropriately high speed so that the read pointer Pr cannot catch up with the write pointer Pw. Hereinafter, the operation of the adaptive speed control unit 108 will be described for a case where the recording / reproducing unit 101 reproduces data at a speed twice (M = 2) the recording speed. Here, it is assumed that the maximum value of the conversion speed is 2, which is the same as the reproduction speed, and the minimum value is 1, which is the same as the recording speed. FIG. 3 shows the relationship between the remaining memory capacity and the conversion speed with respect to it.
This is the rule for setting the conversion speed. FIG.
(A) shows a rule for linearly associating the remaining memory capacity with the conversion speed. In this case, the conversion speed V can be calculated by the following equation.

【0029】[0029]

【数3】 (Equation 3)

【0030】図3(b)はメモリー残量と変換速度を非
線形に対応づける規則の例を示したものである。ここ
で、2次曲線により対応づけるとすると、変換速度Vは
次式により算出できる。
FIG. 3B shows an example of a rule for nonlinearly associating the remaining memory capacity with the conversion speed. Here, assuming that the conversion is made by a quadratic curve, the conversion speed V can be calculated by the following equation.

【0031】[0031]

【数4】 (Equation 4)

【0032】図3(a)の場合は、メモリー残量の増減
に応じてなめらかに変換速度を変更することができ、一
方図3(b)の場合はバッファメモリー105にデータ
がある程度蓄積されるまでは、できるだけ記録速度1に
近いところで安定させることができるという特徴があ
る。
In the case of FIG. 3A, the conversion speed can be smoothly changed according to the increase or decrease of the remaining memory capacity, while in the case of FIG. 3B, data is accumulated to some extent in the buffer memory 105. Until the above, there is a characteristic that the recording speed can be stabilized as close as possible to 1.

【0033】図3(c)は非線形の対応付けを階段上に
規定した場合の例であり、変換速度Vは次式により算出
できる。
FIG. 3C shows an example in which the non-linear correspondence is defined on the steps, and the conversion speed V can be calculated by the following equation.

【0034】[0034]

【数5】 (Equation 5)

【0035】図3(c)に示した規則は、(b)の規則
とほぼ同等の制御を少ない演算量、回路規模で実現する
ことが可能である。
According to the rule shown in FIG. 3C, it is possible to realize substantially the same control as the rule shown in FIG. 3B with a small amount of calculation and a small circuit scale.

【0036】このように、図3の対応規則に基づき変換
速度を決定することにより、2倍速で再生された信号で
も、無音がある量以上存在する入力信号に対しては記録
速度1に近い聞き易い速度を設定することが可能であ
り、また無音の含まれない信号が継続する場合は最大の
変換速度2が設定されるので、データの欠落を生じな
い。なお、ここでは変換速度の最大値を2、最小値を1
としたが、最大値を2より小さな値(例えば1.8)、
また最小値を1より大きな値(例えば1.5)に設定し
ても同様の規則が設定できる。ただし、最大値を2より
小さい値に設定する場合は、無音の含まれない信号が継
続した時に、記録速度の2倍で再生された信号に対して
最大でも2倍未満の速度にしか設定されないため、デー
タの読み出しができずにデータの一部を棄却する必要が
生じる場合がある。これは例えば図2(b)においてPw
がPrに追いついた場合が相当するが、この場合上記で述
べたようにメモリー残量を0にリセットすることによ
り、今までに蓄積されたバッファメモリーの容量分のデ
ータを廃棄していることになる。例えば、バッファメモ
リーの容量を256kビットとし、10kHzサンプリ
ングで1サンプル8ビットデータを扱う場合は、32k
ポイント(約3.2秒分)の有音データを廃棄すること
になる。このような設定を行うことにより、無音の量に
よりデータの一部が欠落するが、変換速度の最大値を低
く抑えることにより、データ全体をよりゆっくりした聞
きやすい速度で再生することが可能となる。
As described above, by determining the conversion speed based on the corresponding rule in FIG. 3, even if the signal is reproduced at the double speed, an input signal having a certain amount of silence or more is heard at a recording speed close to 1. It is possible to set an easy speed, and when a signal that does not include silence continues, the maximum conversion speed 2 is set, so that data loss does not occur. Here, the maximum value of the conversion speed is 2 and the minimum value is 1
But the maximum value is smaller than 2 (for example, 1.8),
The same rule can be set even if the minimum value is set to a value larger than 1 (for example, 1.5). However, when the maximum value is set to a value smaller than 2, when a signal that does not include silence continues, a signal reproduced at twice the recording speed is set to a speed less than at most twice the maximum. Therefore, it may be necessary to reject a part of the data because the data cannot be read. This is, for example, Pw in FIG.
Corresponds to Pr, but in this case, as described above, by resetting the remaining memory to 0, the data corresponding to the capacity of the buffer memory accumulated so far is discarded. Become. For example, if the capacity of the buffer memory is 256 kbits and 8-bit data per sample is handled at 10 kHz sampling, 32 kbits is used.
The point (about 3.2 seconds) of sound data is discarded. By performing such a setting, part of the data is lost due to the amount of silence, but by suppressing the maximum value of the conversion speed, it becomes possible to reproduce the entire data at a slower and easier to hear speed. .

【0037】適応速度制御部108により決定された変
換速度Vの値は時間軸制御部109に送出され、変換速
度Vに応じた時間軸の変換処理が施される。図4は時間
軸制御部109の詳細構成を示すブロック図である。図
4において、401は全体の制御を行う制御回路、40
2は制御回路の指令により重み付け加算を行うクロスフ
ェード処理区間か、無処理区間かを切り替える切換回
路、403は一時的にデータを保持するラッチ回路、4
04は重みづけ加算処理を行うクロスフェード回路であ
り、他のブロックは図1の同名のブロックと同一のもの
であるので同番号を付してある。以下、図4に沿って、
時間軸制御部109の動作を説明する。
The value of the conversion speed V determined by the adaptive speed control unit 108 is sent to the time axis control unit 109, and the time axis is converted according to the conversion speed V. FIG. 4 is a block diagram showing a detailed configuration of the time axis control unit 109. In FIG. 4, reference numeral 401 denotes a control circuit for performing overall control;
Reference numeral 2 denotes a switching circuit for switching between a cross-fade processing section in which weighted addition is performed according to a command from the control circuit and a non-processing section, 403 a latch circuit for temporarily holding data,
Reference numeral 04 denotes a cross-fade circuit for performing a weighted addition process. The other blocks are the same as the blocks having the same names in FIG. Hereinafter, along FIG.
The operation of the time axis control unit 109 will be described.

【0038】制御回路401は、まず変換速度Vを実現
するために、クロスフェード区間長Kと無処理区間長S
を決定する。ここではクロスフェード区間長を固定値K
とするが、変換速度Vに応じてKの値を可変にすること
ももちろん可能である。図5は時間軸変換処理を説明す
るための模式図であり、図5(a)は処理前のデータ、
図5(b)は処理後のデータを表している。また、図5
(b)のデータの長さKに対応する部分はデータAとB
をクロスフェード処理したことを表している。ここで、
変換速度Vを実現するためには、処理前のデータA,
B,Cの合計の長さ(2K+S)の1/Vが時間軸処理
後のデータ長(K+S)になるように長さSを決定すれ
ばよい。そこで、無処理区間長Sは次式により決定され
る。
The control circuit 401 first determines the cross-fade section length K and the non-processing section length S to realize the conversion speed V.
To determine. Here, the crossfade section length is fixed value K
However, it is of course possible to make the value of K variable according to the conversion speed V. FIG. 5 is a schematic diagram for explaining the time axis conversion processing. FIG. 5A shows data before the processing,
FIG. 5B shows the data after the processing. FIG.
The part corresponding to the data length K in (b) is data A and B
Indicates that the cross-fade processing has been performed. here,
In order to realize the conversion speed V, the data A,
The length S may be determined so that 1 / V of the total length (2K + S) of B and C becomes the data length (K + S) after the time axis processing. Therefore, the non-processing section length S is determined by the following equation.

【0039】[0039]

【数6】 (Equation 6)

【0040】今、読み出しポインターPrが図5(a)の
データ列Aの先頭を指しているとして、まずクロスフェ
ード処理について説明する。制御回路401は切換回路
402をクロスフェード処理側に切り換えるとともに、
読み出し制御部106にポインターPrの示すデータを読
み出すよう指令する。このデータはラッチ回路403に
入力され保持される。制御回路401は次にkサンプル
先のPr+Kのアドレスの示すデータを読み出すよう読み
出し制御部106に指令し、このデータは直接クロスフ
ェード回路404に入力される。クロスフェード回路4
04はこの2つのデータを用いて重み付け加算を実行す
る。
Now, assuming that the read pointer Pr points to the head of the data string A in FIG. 5A, the crossfade processing will be described first. The control circuit 401 switches the switching circuit 402 to the cross-fade processing side,
It instructs the read control unit 106 to read the data indicated by the pointer Pr. This data is input to the latch circuit 403 and held. Next, the control circuit 401 instructs the read control unit 106 to read data indicated by the address of Pr + K which is k samples ahead, and this data is directly input to the crossfade circuit 404. Crossfade circuit 4
04 performs weighted addition using these two data.

【0041】ここで、図5(a)のデータ列Aをd0
d1、・・・、dk-1、データ列Bをdk、dk+1、・・・、d
2k-1とする。また単調増加する重み関数をw1(t)(但
し、0≦w1(t)≦1、t=0、1、・・・k-1)、単調減少
する重み関数をw2(t)=1−w1(t)とすると、重み付け加
算後の値ctは次式により得られる。
[0041] Here, the data string A in FIG. 5 (a) d 0,
d 1 ,..., d k−1 , and the data string B are d k , d k + 1 ,.
2k-1 . The weighting function that monotonically increases is w 1 (t) (where 0 ≦ w 1 (t) ≦ 1, t = 0, 1,..., K−1), and the weighting function that monotonically decreases is w 2 (t). = 1-w 1 (t), the value c t of the weighted sum is obtained by the following equation.

【0042】[0042]

【数7】 (Equation 7)

【0043】この後、読み出しポインターPrはインクリ
メントされ、以降制御回路は上記と同様の処理をK回続
け、図5(a)のデータ列AとBとのクロスフェード処
理が全て終了後、読み出しポインターにはその時点のPr
+Kの値が設定される。クロスフェード処理が終了する
と、制御回路401は切換回路402を無処理側に切り
換え、バッファメモリー105から読み出されたデータ
は(数6)で決定された長さS分のデータが直接D/A
変換器110に入力される。以降、長さKのクロスフェ
ード処理と、長さSの無処理データの出力を交互に繰り
返すことにより、変換速度Vを与える時間軸変換が実現
できる。ある時点で適応速度制御部108で設定された
変換速度が変更された場合は、(数6)により無処理区
間長を変更し、以降上記と同様の処理を続けることによ
り、随時変換速度を変更する。
Thereafter, the read pointer Pr is incremented, and thereafter, the control circuit continues the same processing as described above K times, and after all the cross-fade processing between the data strings A and B in FIG. Is the current Pr
The value of + K is set. When the cross-fade processing is completed, the control circuit 401 switches the switching circuit 402 to the non-processing side, and the data read from the buffer memory 105 is directly the D / A data of the length S determined by (Equation 6).
Input to converter 110. Thereafter, by alternately repeating the cross-fade processing of the length K and the output of the unprocessed data of the length S, time axis conversion giving the conversion speed V can be realized. If the conversion speed set by the adaptive speed control unit 108 is changed at a certain point in time, the non-processing section length is changed according to (Equation 6), and thereafter the same processing is continued to change the conversion speed at any time. I do.

【0044】このようにして時間軸変換処理されたデー
タ列は、最終的に周期TでD/A変換器110によりア
ナログ信号に変換されることにより、記録時と音程が同
一で再生速度M以下で速度が適応的に切り替わる音声信
号を得ることができる。
The data sequence that has been subjected to the time axis conversion processing in this manner is finally converted into an analog signal by the D / A converter 110 with a period T, so that the pitch is the same as during recording and the reproduction speed is M or less. Thus, an audio signal whose speed is adaptively switched can be obtained.

【0045】以上のように、上記した第1の実施例によ
ると、有音無音判定部103と、書き込みポインターと
読み出しポインターの位置関係からメモリー残量を計測
するメモリー残量監視部107と、メモリー残量に応じ
て時間軸変換の速度を決定する適応速度制御部108と
を設け、メモリー残量が少ない時は変換速度を徐々に遅
く、メモリー残量が多い時には徐々に速く制御すること
により、高速に再生された音声信号をその中に含まれる
無音の量に応じて再生速度以下のゆっくりした速度で、
しかも情報の欠落がほとんどなく、高速に聴取すること
が可能となる。また、クロスフェード区間長と無処理区
間長を調整することにより、所望の変換速度で時間軸を
変換する時間軸制御部109を設けたことにより、高品
質の時間軸変換が実現できるとともに、特にクロスフェ
ード区間長を予め設定した値に固定すると、無処理区間
の長さのみを変更するだけで任意の時間軸変換の速度が
達成され、非常に簡単な構成で音声時間軸変換装置を実
現することができる。特にVTRなどのように画像を伴
った記録再生部では、例えば画像は2倍速再生で、音声
のみを2倍速以下のゆっくりした速度で再生することが
でき、効果が大きい。
As described above, according to the first embodiment, the sound / non-speech judging unit 103, the memory remaining amount monitoring unit 107 for measuring the remaining memory from the positional relationship between the write pointer and the read pointer, and the memory By providing an adaptive speed control unit 108 that determines the speed of the time axis conversion according to the remaining amount, by gradually lowering the conversion speed when the remaining memory amount is small, and gradually increasing the conversion speed when the remaining memory amount is large, Depending on the amount of silence contained in the audio signal played at high speed, the playback speed is slower than the playback speed,
Moreover, there is almost no loss of information, and it is possible to listen at high speed. In addition, by providing the time axis control unit 109 that converts the time axis at a desired conversion speed by adjusting the cross fade section length and the non-processing section length, high-quality time axis conversion can be realized. If the crossfade section length is fixed to a preset value, an arbitrary time axis conversion speed can be achieved only by changing the length of the non-processing section, and an audio time axis conversion apparatus can be realized with a very simple configuration. be able to. Particularly, in a recording / reproducing unit accompanied by an image such as a VTR, for example, an image can be reproduced at a double speed and only an audio can be reproduced at a slow speed of 2 times or less, which is highly effective.

【0046】次に、本発明の音声時間軸変換装置の第2
の実施例について説明する。本実施例の音声時間軸変換
装置の基本構成は図1に示したブロック図と同一であ
り、書き込み制御部104の動作のみが異なる。図6は
本実施例の書き込み制御部の動作を示すフローチャート
である。以下では、図6を参照しながら書き込み制御部
の動作についてのみ説明する。
Next, the second embodiment of the audio time base conversion apparatus of the present invention will be described.
An example will be described. The basic configuration of the audio time axis conversion device of the present embodiment is the same as the block diagram shown in FIG. 1, and only the operation of the writing control unit 104 is different. FIG. 6 is a flowchart illustrating the operation of the write control unit according to the present embodiment. Hereinafter, only the operation of the write control unit will be described with reference to FIG.

【0047】書き込み動作部104は、メモリー残量監
視部107より計測されたメモリー残量Zの値を逐次取
り込み(S1)、予め設定したしきい値Zthと比較する
(S2)。ここで、ZがZthよりも大きければ、即ち十
分にメモリー残量がある場合は、有音無音判定部103
の結果から現在の入力データが有音であるか無音である
かを判断し(S3)、有音である場合のみそのデータを
バッファメモリー105に書き込み(S4)、書き込み
ポインターPwをインクリメントする(S5)。S3の
判定条件を満足しない場合、即ちメモリー残量が十分に
存在しない場合は、有音無音の判定結果にかかわらず、
データをバッファメモリー105に書き込み、書き込み
ポインターPwをインクリメントする。上記した一連の
処理は具体的には、無音が多く含まれる信号の場合に、
図2(a)において読み出しポインターPrが書き込み
ポインターPwに追いつかないよう、即ちメモリー残量
が0にならないように制御していることになる。
The write operation unit 104 sequentially takes in the value of the remaining memory Z measured by the remaining memory monitoring unit 107 (S1) and compares it with a preset threshold value Zth (S2). Here, if Z is larger than Zth, that is, if there is a sufficient remaining memory, the sound / silence determination unit 103
It is determined whether the current input data is voiced or silent based on the result (S3), and if it is voiced, the data is written to the buffer memory 105 (S4), and the write pointer Pw is incremented (S5). ). If the determination condition of S3 is not satisfied, that is, if there is not enough remaining memory, regardless of the determination result of sound / no sound,
The data is written into the buffer memory 105, and the write pointer Pw is incremented. Specifically, the above-described series of processing is performed for a signal including a lot of silence,
In FIG. 2A, control is performed so that the read pointer Pr does not catch up with the write pointer Pw, that is, the remaining memory does not become zero.

【0048】以上のように、上記した第2の実施例によ
ると、メモリー残量が予め定めた一定量より少ないとき
には全データをバッファメモリーに蓄積する書き込み制
御部を設けたことにより、メモリー残量が0にならずに
再生音が途切れる(ミュート状態になる)ことが防止さ
れ、違和感のない自然な再生が可能な音声時間軸変換装
置を実現することができる。
As described above, according to the second embodiment, when the remaining amount of memory is smaller than a predetermined amount, the write control unit for accumulating all data in the buffer memory is provided. Can be prevented from being interrupted (becoming a mute state) without causing the sound to be converted to 0, and a sound time base conversion apparatus capable of natural reproduction without a sense of incongruity can be realized.

【0049】[0049]

【発明の効果】以上のように、本発明の音声時間軸変換
装置は、記録速度のM(≧1)倍で再生された音響信号
から有音無音判定により有音部分のみをバッファメモリ
ーに蓄積し、書き込みと読み出しのアドレス位置からメ
モリー残量を計測し、その残量に応じて残量の少ないと
きはできるだけ低速に、残量が多くなるにつれて徐々に
高速になるように無音の量に応じて自動的に変換速度を
調整できるように構成したことにより、高速再生時に、
音程は記録時と同一で、しかも再生速度よりも遅い聞き
やすい速度で音声を再生することが可能な音声時間軸変
換装置を提供することができる。
As described above, according to the audio time base conversion apparatus of the present invention, only the sound part is stored in the buffer memory by the sound / non-speech judgment from the sound signal reproduced at M (≧ 1) times the recording speed. Then, the remaining memory is measured from the write and read address positions, and according to the amount of silence, the speed becomes as low as possible when the remaining capacity is low, and gradually increases as the remaining capacity increases. The conversion speed can be automatically adjusted by
It is possible to provide an audio time base conversion apparatus capable of reproducing a sound at the same pitch as that at the time of recording and at an easy-to-listen speed lower than the reproduction speed.

【0050】また、クロスフェード区間長と無処理区間
長を調整することにより、所望の変換速度に時間軸を変
換する時間軸制御部を設けたことにより、特にクロスフ
ェード区間長を一定にすれば、無処理区間の長さを調節
するだけで任意の変換速度が達成でき、高品質の時間軸
変換された再生音を簡単な回路構成で実現できる。
Further, by providing a time axis control unit for converting the time axis to a desired conversion speed by adjusting the cross fade section length and the unprocessed section length, especially when the cross fade section length is kept constant. By simply adjusting the length of the non-processing section, an arbitrary conversion speed can be achieved, and a high-quality time-base converted reproduced sound can be realized with a simple circuit configuration.

【0051】また、メモリー残量が少ない時には、有音
無音の判定にかかわらず全てのデータをバッファメモリ
ーに記憶するように構成することにより、出力するデー
タがなくなり再生途中でミュート状態になることがな
く、違和感のない自然な再生音声を出力することのでき
る音声時間軸変換装置を提供することができる。
When the remaining memory capacity is low, all data is stored in the buffer memory regardless of the presence or absence of sound or no sound, so that there is no data to be output and a mute state occurs during playback. It is possible to provide an audio time base conversion device capable of outputting natural reproduced audio without a sense of incongruity.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の一実施例における音声時間軸変換装置
の構成を示すブロック図
FIG. 1 is a block diagram showing a configuration of an audio time base conversion apparatus according to an embodiment of the present invention.

【図2】本実施例に係るメモリー残量の計測方法の説明
FIG. 2 is an explanatory diagram of a method of measuring a remaining memory amount according to the embodiment;

【図3】本実施例に係る適応速度制御部の速度設定方法
の説明図
FIG. 3 is an explanatory diagram of a speed setting method of an adaptive speed control unit according to the embodiment.

【図4】本実施例に係る時間軸制御部の回路図FIG. 4 is a circuit diagram of a time axis control unit according to the embodiment.

【図5】本実施例に係る時間軸制御部の動作を示す原理
FIG. 5 is a principle diagram illustrating an operation of a time axis control unit according to the embodiment;

【図6】本発明の第2の実施例に係る書き込み制御部を
動作を示すフローチャート
FIG. 6 is a flowchart showing the operation of a write control unit according to a second embodiment of the present invention;

【図7】従来例の音声時間軸変換装置のブロック構成図FIG. 7 is a block diagram of a conventional audio time base conversion apparatus.

【図8】従来例の音声時間軸変換装置のデータ処理方法
を示す原理図
FIG. 8 is a principle diagram showing a data processing method of a conventional audio time base conversion apparatus.

【符号の説明】[Explanation of symbols]

101 記録再生部 102 A/D変換器 103 有音無音判定部 104 書き込み制御部 105 バッファメモリー 106 読みだし制御部 107 メモリー残量監視部 108 適応速度制御部 109 時間軸制御部 110 D/A変換器 Reference Signs List 101 recording / reproducing unit 102 A / D converter 103 sound / non-sound determining unit 104 write control unit 105 buffer memory 106 read control unit 107 remaining memory monitoring unit 108 adaptive speed control unit 109 time axis control unit 110 D / A converter

───────────────────────────────────────────────────── フロントページの続き (72)発明者 上野 憲和 大阪府門真市大字門真1006番地 松下電 器産業株式会社内 (56)参考文献 特開 平7−192392(JP,A) 特開 平5−73089(JP,A) 特開 平7−191695(JP,A) 特開 平6−289895(JP,A) 特開 平3−205656(JP,A) (58)調査した分野(Int.Cl.7,DB名) G10L 21/00 - 21/06 ──────────────────────────────────────────────────続 き Continuation of the front page (72) Inventor Norikazu Ueno 1006 Kazuma Kadoma, Kadoma-shi, Osaka Matsushita Electric Industrial Co., Ltd. (56) References JP-A-7-192392 (JP, A) JP-A-5-192 73089 (JP, A) JP-A-7-191695 (JP, A) JP-A-6-289895 (JP, A) JP-A-3-205656 (JP, A) (58) Fields investigated (Int. 7 , DB name) G10L 21/00-21/06

Claims (6)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】 記録媒体に記憶された音響信号を記録時
のM(≧1)倍の速度で読み出す記録再生部と、前記記
録再生部で読み出されたアナログ音響信号をディジタル
信号に変換するA/D変換器と、入力信号の無音部分と
有音部分を判定する有音無音判定部と、ディジタル変換
されたデータを蓄積するためのバッファメモリーと、前
記有音無音判定部で有音と判定された区間のデータのみ
を前記バッファメモリーに書き込むように書き込みアド
レスを制御する書き込み制御部と、前記バッファメモリ
ーのデータを読み出す読み出し制御部と、前記書き込み
制御部で最後に前記バッファメモリーに書き込まれたア
ドレスと前記読み出し制御部で最後に読み出された前記
バッファメモリー上のアドレスとの位置関係を監視する
ことにより前記バッファメモリー内のメモリー残量を計
測するメモリー残量監視部と、前記メモリー残量監視部
から得られたメモリー残量に応じて予め定めた規則に従
ってデータの時間軸変換の速度を決定する適応速度制御
部と、前記適応速度制御部で決定された変換速度に従っ
て、前記読み出し制御部が示すバッファメモリーのアド
レスから逐次データを読み出しながら音声の時間軸の圧
縮を行い出力する時間軸制御部と、前記時間軸制御部に
より得られた圧縮処理後のデータを受けてアナログ信号
に変換するD/A変換器とを備えたことを特徴とする音
声時間軸変換装置。
1. A recording / reproducing section for reading an audio signal stored in a recording medium at a speed M (≧ 1) times that at the time of recording, and converting an analog audio signal read by the recording / reproducing section into a digital signal. An A / D converter, a voiced / silent determining unit for determining a voiced portion and a voiced portion of the input signal, a buffer memory for storing digitally converted data, and a voiced / voiceless sound determining unit. A write control unit that controls a write address so that only data in the determined section is written to the buffer memory; a read control unit that reads data from the buffer memory; and a write control unit that is written to the buffer memory last by the write control unit. By monitoring the positional relationship between the read address and the address on the buffer memory last read by the read control unit, A memory remaining amount monitoring unit for measuring the remaining amount of memory in the memory, and an adaptive speed for determining a time axis conversion speed of data according to a predetermined rule according to the remaining amount of memory obtained from the memory remaining amount monitoring unit. A control unit and an address of the buffer memory indicated by the read control unit according to the conversion speed determined by the adaptive speed control unit.
While reading the data sequentially from the
A time axis control unit that performs compression and outputs the data, and a D / A converter that receives the data after compression processing obtained by the time axis control unit and converts the data into an analog signal. Conversion device.
【請求項2】適応速度制御部は、設定する変換速度の最
大値を前記記録媒体からの再生速度Mと同じあるいはそ
れ以下、最小値を記録媒体の記録速度と同じあるいはそ
れ以上とし、メモリー残量に比例して変換速度を決定す
ることを特徴とする請求項1記載の音声時間軸変換装
置。
2. The adaptive speed control section sets the maximum value of the set conversion speed to be equal to or less than the reproduction speed M from the recording medium, sets the minimum value to be equal to or higher than the recording speed of the recording medium, 2. The audio time base conversion device according to claim 1, wherein the conversion speed is determined in proportion to the amount.
【請求項3】適応速度制御部は、設定する変換速度の最
大値を前記記録媒体からの再生速度Mと同じあるいはそ
れ以下、最小値を記録媒体の記録速度と同じあるいはそ
れ以上とし、メモリー残量と非線形に対応付けした変換
規則に基づき変換速度を決定することを特徴とする請求
項1記載の音声時間軸変換装置。
3. The adaptive speed control unit sets the maximum value of the set conversion speed to be equal to or less than the reproduction speed M from the recording medium, sets the minimum value to be equal to or higher than the recording speed of the recording medium, 2. The audio time base conversion apparatus according to claim 1, wherein the conversion speed is determined based on a conversion rule that is nonlinearly associated with the quantity.
【請求項4】 時間軸制御部は、隣合う一定個数毎のサ
ンプル値列に、それぞれ、単調減少する重み係数を掛け
合わせた値と単調増加する重み係数を掛け合わせた値と
を加算するクロスフェード処理区間の長さと、データを
直接出力する無処理区間の長さを、前記適応速度制御部
で得られる時間軸変換速度になるように逐次調整し、そ
れぞれの区間を交互に出力することにより、時間軸が圧
縮された信号を出力することを特徴とする請求項1、請
求項2、請求項3のいずれかに記載の音声時間軸変換装
置。
4. A time axis control unit for adding a value obtained by multiplying a sequence of sample values of a fixed number adjacent to each other by a monotonically decreasing weighting factor and a value obtained by monotonically increasing a weighting factor. The adaptive speed control unit controls the length of the fade processing section and the length of the non-processing section for directly outputting data.
It is adjusted successively so that the time axis conversion speed obtained by
By outputting each section alternately, the time axis
4. The audio time base conversion device according to claim 1, wherein a reduced signal is output .
【請求項5】書き込み制御部は、メモリー残量監視部で
メモリー残量が一定量以上の時は有音無音判定部で有音
と判定されたデータのみをバッファメモリーに蓄積し、
前記メモリー残量監視部でメモリー残量が一定量以下で
あると判定された場合には、前記有音無音判定部の結果
に関わらず、すべてのデータを前記バッファメモリーに
蓄積するように書き込みアドレスを制御することを特徴
とする請求項1記載の音声時間軸変換装置。
5. A writing control unit, wherein when the remaining memory amount is equal to or more than a predetermined amount in the remaining memory amount monitoring unit, only the data determined to be sound by the sound / non-sound determining unit is stored in the buffer memory.
If the memory remaining amount monitoring unit determines that the memory remaining amount is equal to or less than a certain amount, the write address is stored so that all data is stored in the buffer memory regardless of the result of the sound / silence determining unit. 2. The audio time axis conversion device according to claim 1, wherein
【請求項6】書き込み制御部は、メモリー残量監視部で
メモリー残量が一定量以上の時は有音無音判定部で有音
と判定されたデータのみをバッファメモリーに蓄積し、
前記メモリー残量監視部でメモリー残量が一定量以下で
あると判定された場合には、前記有音無音判定部の結果
に関わらず、すべてのデータを前記バッファメモリーに
蓄積するように書き込みアドレスを制御することを特徴
とする請求項4記載の音声時間軸変換装置。
6. The writing control section stores only data determined to be sound by the sound / non-sound determination section in the buffer memory when the remaining memory amount is equal to or more than a predetermined amount in the memory remaining amount monitoring section,
If the memory remaining amount monitoring unit determines that the memory remaining amount is equal to or less than a certain amount, the write address is stored so that all data is stored in the buffer memory regardless of the result of the sound / silence determining unit. 5. The audio time axis conversion device according to claim 4, wherein
JP22013194A 1994-09-14 1994-09-14 Audio time base converter Expired - Fee Related JP3189587B2 (en)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP22013194A JP3189587B2 (en) 1994-09-14 1994-09-14 Audio time base converter
EP95306302A EP0702354A1 (en) 1994-09-14 1995-09-08 Apparatus for modifying the time scale modification of speech
CN 95117716 CN1131794A (en) 1994-09-14 1995-09-14 Apparatus for modifying time scale modification of speech

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP22013194A JP3189587B2 (en) 1994-09-14 1994-09-14 Audio time base converter

Publications (2)

Publication Number Publication Date
JPH0883096A JPH0883096A (en) 1996-03-26
JP3189587B2 true JP3189587B2 (en) 2001-07-16

Family

ID=16746396

Family Applications (1)

Application Number Title Priority Date Filing Date
JP22013194A Expired - Fee Related JP3189587B2 (en) 1994-09-14 1994-09-14 Audio time base converter

Country Status (1)

Country Link
JP (1) JP3189587B2 (en)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4895418B2 (en) * 1999-08-24 2012-03-14 ソニー株式会社 Audio reproduction method and audio reproduction apparatus
JP2010191415A (en) * 1999-08-24 2010-09-02 Sony Corp Method and apparatus regenerating voice
KR20030000400A (en) * 2001-06-25 2003-01-06 주식회사 보이스텍 Method and apparatus for real- time modification of audio play speed
JP4406838B2 (en) 2005-02-15 2010-02-03 ソニー株式会社 Audio input / output control apparatus and audio input / output control method

Also Published As

Publication number Publication date
JPH0883096A (en) 1996-03-26

Similar Documents

Publication Publication Date Title
JP4334355B2 (en) Trick mode audio playback
US6085157A (en) Reproducing velocity converting apparatus with different speech velocity between voiced sound and unvoiced sound
JP3189587B2 (en) Audio time base converter
JP2874607B2 (en) Audio time base converter
JP3162945B2 (en) Video tape recorder
EP0702354A1 (en) Apparatus for modifying the time scale modification of speech
JP3357742B2 (en) Speech speed converter
JPH0573089A (en) Speech reproducing method
JP3189597B2 (en) Audio time base converter
JP3081469B2 (en) Speech speed converter
JPH08328586A (en) Phonetic time axis conversion device
JPH05303400A (en) Method and device for audio reproduction
JP2905215B2 (en) Recording and playback device
JPH04367898A (en) Method and device for voice reproduction
JP2001318700A (en) Speech speed converter
JPH06309895A (en) Semiconductor memory audio recording and reproducing device
KR20010085664A (en) Speech speed converting device
JP2962777B2 (en) Audio signal time-base expansion / compression device
JPH09154107A (en) Video and sound signal reproducing device
JPH08292796A (en) Reproducing device
JP2861005B2 (en) Audio storage and playback device
JPH08293137A (en) Reproducing device
JPH08255000A (en) Voice signal reproducing device
JP3003502B2 (en) Gain adjustment device
JPH0438767A (en) Sound recording and reproducing method

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees