JPH05303400A - Method and device for audio reproduction - Google Patents
Method and device for audio reproductionInfo
- Publication number
- JPH05303400A JPH05303400A JP4109459A JP10945992A JPH05303400A JP H05303400 A JPH05303400 A JP H05303400A JP 4109459 A JP4109459 A JP 4109459A JP 10945992 A JP10945992 A JP 10945992A JP H05303400 A JPH05303400 A JP H05303400A
- Authority
- JP
- Japan
- Prior art keywords
- compression ratio
- time domain
- speed
- recording
- output
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
Description
【0001】[0001]
【産業上の利用分野】本発明は記録された音声信号の速
度を記録時に比べて高速再生する音声再生装置と音声再
生方法に関するものである。BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an audio reproducing apparatus and an audio reproducing method for reproducing the speed of a recorded audio signal faster than that at the time of recording.
【0002】[0002]
【従来の技術】従来より、記録した音声信号の再生速度
を可変する機能をもつ様々な装置が提案されている。最
も簡単な例はアナログテープレコーダのキュー(早送り
再生)、レビュー(巻戻し再生)であるが、これらの高
速再生音声は記録時の音声と比べると音程・速度の両方
が変化しているため、内容を聴取することや頭出しを行
うことはほとんど不可能である。また、高速再生時に音
程が変化しないように補償を行う装置も提案されてい
る。以下、音程補償を行なう従来の音声再生装置につい
て、図面を参照しながら説明を行なう。2. Description of the Related Art Conventionally, various devices having a function of varying the reproduction speed of a recorded audio signal have been proposed. The simplest examples are cue (fast forward playback) and review (rewind playback) of an analog tape recorder, but these high-speed playback voices have both pitch and speed changed compared to the voice at the time of recording, It is almost impossible to listen to the content or to cue. There is also proposed a device that performs compensation so that the pitch does not change during high-speed reproduction. Hereinafter, a conventional audio reproducing device that performs pitch compensation will be described with reference to the drawings.
【0003】図11は、従来の音声再生装置の構成を示
すものである。同図において、201は信号再生手段、
202はAD変換器、203はディジタルメモリ、20
4はDA変換器、205はクロックレート設定手段、2
06はメモリ制御手段である。FIG. 11 shows the structure of a conventional audio reproducing apparatus. In the figure, 201 is a signal reproducing means,
202 is an AD converter, 203 is a digital memory, 20
4 is a DA converter, 205 is a clock rate setting means, 2
Reference numeral 06 is a memory control means.
【0004】以上のように構成された音声再生装置につ
いて、以下その動作について説明する。ここでは、記録
時の再生速度より高速に再生する場合において、通常の
速度及び音程に戻して再生する装置について示す。The operation of the audio reproducing apparatus having the above structure will be described below. Here, in the case of reproducing at a speed higher than the reproducing speed at the time of recording, an apparatus for returning to a normal speed and pitch and reproducing is shown.
【0005】記録速度に対してRt倍(Rt > 0)の相対速度
で音響信号を再生する。信号再生手段201は、磁気テ
ープなどに記録されている音響信号を電気信号に変換し
て、適切なレベルの信号として取り出す。この信号は音
程および速度は通常のRt倍になっているため、内容を理
解するのは困難である。そして、信号再生手段201の
出力はAD変換器202によりディジタル信号に変換さ
れる。AD変換器202のサンプリング周期はクロック
レート設定手段205によって相対速度Rtに反比例する
サンプリング周期Tn/Rtに変換される。前記ディジタル
信号はメモリ制御手段206の制御に従って周期Tn/Rt
で、ディジタルメモリ203の所定のアドレスに書き込
まれる。ディジタルメモリ203は、データを一時的に
記憶するバッファメモリとして機能させている。そし
て、ディジタルメモリ203に記録されたディジタル信
号はメモリ制御手段206によって示されるアドレスの
データを周期Tnで順次読み出して、DA変換器204で
サンプリング周期Tnでアナログ信号へ戻されて出力され
る。An acoustic signal is reproduced at a relative speed that is Rt times (Rt> 0) the recording speed. The signal reproducing means 201 converts an acoustic signal recorded on a magnetic tape or the like into an electric signal and extracts it as a signal having an appropriate level. It is difficult to understand the content because the pitch and speed of this signal are Rt times as high as usual. Then, the output of the signal reproducing means 201 is converted into a digital signal by the AD converter 202. The sampling cycle of the AD converter 202 is converted by the clock rate setting means 205 into a sampling cycle Tn / Rt which is inversely proportional to the relative speed Rt. The digital signal has a cycle Tn / Rt under the control of the memory control means 206.
Then, it is written in a predetermined address of the digital memory 203. The digital memory 203 functions as a buffer memory that temporarily stores data. Then, the digital signal recorded in the digital memory 203 sequentially reads out the data of the address indicated by the memory control means 206 at the cycle Tn, and is converted into an analog signal at the sampling cycle Tn by the DA converter 204 and output.
【0006】次に、高速再生時に変化している音程と速
度を、記録時すなわち通常の音程と速度に戻すかについ
て示す。VTRやカセットテープレコーダなどを記録時
より高速で再生すると、再生される周波数が高くなる方
向にシフトしてしまう。いま、記録時の音響信号につい
て、標本化定理が満足されるサンプリング周期をTnであ
るとすると、高速再生された音響信号をディジタル信号
にAD変換する際には記録時に必要なサンプリング周期
の1/Rt倍、すなわち、Tn/Rtで標本化する必要があ
る。逆に、相対速度Rtで高速再生するときに、サンプリ
ング周期をTn/RtでAD変換した信号をサンプリング周
期TnでDA変換することによって、通常の音程の音響信
号が復元されることになる。ここで、AD変換したすべ
てのデータを再生するのは当然のことながら時間的に不
可能なので、入力音声の一部分のみを通常の速度と音程
で連続して再生し、残りの大部分は廃棄するという操作
を繰り返すことになる。Next, it will be described whether the pitch and speed changing during high-speed reproduction are returned to the normal pitch and speed during recording. When a VTR, a cassette tape recorder, or the like is reproduced at a higher speed than during recording, the reproduced frequency shifts toward a higher direction. Now, assuming that the sampling period that satisfies the sampling theorem for the acoustic signal at the time of recording is Tn, at the time of AD converting the acoustic signal reproduced at high speed to 1 / It is necessary to sample by Rt times, that is, Tn / Rt. On the contrary, when performing high-speed reproduction at the relative speed Rt, a signal obtained by AD-converting the sampling cycle with Tn / Rt is DA-converted with the sampling cycle Tn, whereby an acoustic signal having a normal pitch is restored. Since it is naturally impossible to reproduce all the AD-converted data in terms of time, only a part of the input voice is continuously reproduced at a normal speed and pitch, and most of the rest is discarded. The operation will be repeated.
【0007】図12は相対速度5の場合の処理の概要を
示すデータ処理例である。同図において、Tfは高速再生
を行った時の処理の繰り返し周期であり、TcはAD変換
したデータを必要な量だけディジタルメモリに書き込み
を行うのに必要な時間である。図12(b)の未処理デー
タの図よりわかるように、高速再生時に実際に使用され
るデータと使用されずに廃棄されるデータの比はTc:(Tf
-Tc)、即ち1:4である。従って、記録時の音響信号5T
fの時間のうち実際に聴取できる時間がTfであり、残り
の4Tfの時間のデータは廃棄されてしまう。この処理を
高速再生して周期Tfで繰り返すものである。ここでディ
ジタルメモリに記憶するデータ量が64Kワードの場合
に、相対速度を5、基準となるサンプリング周期を50
[μsec]とすると、Tfは3.2768[sec]となる。すなわち、
相対速度5で高速再生を行っているときには、記録時の
音響信号を16.384[sec]毎に3.2768[sec]だけ取り出して
聴取していることになる。また、再生信号のうちで廃棄
されるデータ量の割合を廃棄率Raとすると、次式のよう
に表される。FIG. 12 is an example of data processing showing an outline of processing when the relative speed is 5. In the figure, Tf is the repetition cycle of the processing when high-speed reproduction is performed, and Tc is the time required to write the AD-converted data in the required amount in the digital memory. As can be seen from the diagram of the unprocessed data in Fig. 12 (b), the ratio of the data actually used and the data discarded without being used at the time of high speed reproduction is Tc: (Tf
-Tc), i.e. 1: 4. Therefore, the acoustic signal during recording 5T
Of the time of f, the time that can be actually heard is Tf, and the data of the remaining time of 4Tf is discarded. This processing is reproduced at high speed and repeated at the cycle Tf. Here, when the amount of data stored in the digital memory is 64 K words, the relative speed is 5 and the reference sampling period is 50.
If it is [μsec], Tf will be 3.2768 [sec]. That is,
During high-speed reproduction at a relative speed of 5, it means that the audio signal at the time of recording is taken out for every 3.2384 [sec] every 16.384 [sec] for listening. Further, when the ratio of the amount of data to be discarded in the reproduced signal is the discard rate Ra, it is expressed by the following equation.
【0008】[0008]
【数5】 [Equation 5]
【0009】図12の例では相対速度を5に設定してい
るので、廃棄率Raは0.8となり、再生信号の多くの部分
が全く利用できずに廃棄されている。次に出力として聴
取される音響信号と実際に再生している入力信号とは遅
延時間を生じているので、出力として聴取される音響信
号をもとに所望の信号部分をサーチするとすると、大き
なズレを生じることになる。この入出力信号間の最大遅
延量の値を Tdとすると次式のように表される。Since the relative speed is set to 5 in the example of FIG. 12, the discard rate Ra is 0.8, and most of the reproduced signal cannot be used and is discarded. Since a delay time is generated between the acoustic signal that is next heard as the output and the input signal that is actually being reproduced, if a desired signal portion is searched based on the acoustic signal that is heard as the output, a large deviation will occur. Will occur. Let Td be the maximum delay between the input and output signals.
【0010】[0010]
【数6】 [Equation 6]
【0011】この式より、TdはTfの関数でもあるのでこ
れを小さくすることで最大遅延を少なくすることも可能
ではあるが、あまりTfを小さくし過ぎてしまうと内容を
認知できなくなって、音響信号によるサーチはできなく
なる。図12の例では、Tfが3.2768[sec]に対して最大
遅延量Tdは、13.08[sec]となる。図13に相対速度Rtと
圧縮率Sc、廃棄率Raおよび最大遅延量Tdの関係を示す。From this equation, since Td is also a function of Tf, it is possible to reduce the maximum delay by making it smaller, but if Tf is made too small, the content cannot be recognized and the acoustic Search by signal cannot be performed. In the example of FIG. 12, the maximum delay amount Td is 13.08 [sec] while Tf is 3.2768 [sec]. FIG. 13 shows the relationship among the relative speed Rt, the compression rate Sc, the discard rate Ra, and the maximum delay amount Td.
【0012】[0012]
【発明が解決しようとする課題】以上に示したように、
従来例では再生すべき音響信号のうちの大部分を全く使
用せずに廃棄してしまう。そして、廃棄されるデータ量
の割合は高速再生する相対速度Rtが大きくなるほど増加
する。また、廃棄率が大きくなるに伴って、入力信号に
含まれる情報を聞き逃す確率が高くなることや、聴取さ
れる音響信号と現在再生している音響信号部分との最大
遅延量が増大することにより、所望の信号部分を再生音
を元にサーチすることは困難となる。[Problems to be Solved by the Invention] As shown above,
In the conventional example, most of the audio signals to be reproduced are discarded without being used at all. Then, the ratio of the amount of data to be discarded increases as the relative speed Rt for high speed reproduction increases. Also, as the discard rate increases, the probability of missing the information contained in the input signal increases, and the maximum delay amount between the audio signal being listened to and the audio signal currently being reproduced increases. Therefore, it becomes difficult to search for a desired signal portion based on the reproduced sound.
【0013】本発明は上記従来の問題点を解決するもの
で、記録時と同じ音程を保ちつつ廃棄率を小さく、しか
も入出力信号間の遅延量を少なくすることができる音声
生成装置および音声再生方法を提供することを目的とす
る。The present invention solves the above-mentioned problems of the prior art. A voice generation apparatus and a voice reproduction capable of reducing the discard rate and the delay amount between input and output signals while maintaining the same pitch as during recording. The purpose is to provide a method.
【0014】[0014]
【課題を解決するための手段】この目的を達成するため
に請求項1記載の音声再生装置では、ディジタルメモリ
から読み出したディジタル信号を時間領域伸縮を行う時
間領域伸縮処理手段と相対速度と閾値との比較を行う比
較手段とを有する構成としている。To achieve this object, in a voice reproducing apparatus according to a first aspect of the present invention, a time domain expansion / compression processing means for expanding / compressing a digital signal read from a digital memory in a time domain, a relative speed and a threshold value. And a comparison means for comparing
【0015】請求項2記載の音声再生装置では、圧縮比
設定手段および選択手段の動作モードを決定し、時間領
域伸縮すべき圧縮比の値を求めるモード制御手段とディ
ジタルメモリから読み出したディジタル信号を時間領域
伸縮処理手段で時間領域伸縮する、あるいはそのままの
出力するかを選択する選択手段とを有する構成としてい
る。In the audio reproducing apparatus according to the second aspect, the operation mode of the compression ratio setting means and the selecting means is determined, and the digital signal read from the mode control means and the digital memory for obtaining the value of the compression ratio to be expanded / contracted in the time domain. The time domain expansion / contraction processing section is configured to have a selection section for selecting whether to expand / contract the time domain or output as it is.
【0016】請求項3記載の音声再生方法では、ディジ
タルメモリから読み出したディジタル信号を相対速度Rt
の値に応じてIn the voice reproducing method according to the third aspect, the digital signal read from the digital memory is used as the relative speed Rt.
Depending on the value of
【0017】[0017]
【数7】 [Equation 7]
【0018】に示す圧縮比Scで時間領域圧縮を行うアル
ゴリズムを用いている。請求項4記載の音声再生方法で
は、ディジタルメモリから読み出したディジタル信号を
相対速度Rtの値に応じてAn algorithm for performing time domain compression with a compression ratio Sc shown in is used. In the voice reproducing method according to claim 4, the digital signal read out from the digital memory is output according to the value of the relative speed Rt.
【0019】[0019]
【数8】 [Equation 8]
【0020】に示す圧縮比Scで時間領域圧縮を行うアル
ゴリズムを用いている。請求項5記載の音声再生方法で
は、ディジタルメモリから読み出したディジタル信号を
相対速度Rtの値に応じてAn algorithm for performing time domain compression with a compression ratio Sc shown in is used. In the voice reproducing method according to claim 5, the digital signal read from the digital memory is changed in accordance with the value of the relative speed Rt.
【0021】[0021]
【数9】 [Equation 9]
【0022】に示す圧縮比Scで時間領域圧縮を行うアル
ゴリズムを用いている。An algorithm for performing time domain compression with a compression ratio Sc shown in is used.
【0023】[0023]
【作用】請求項1記載の構成により、所定の閾値以上の
相対速度の場合には時間領域伸縮処理によって通常の音
程を保ちつつ記録時より速く音響信号を再生することに
より、従来より多くの音響信号を同一時間で再生できる
ので、記録時と同じ音程を保ちつつ廃棄率および入出力
信号間の最大遅延量を従来より少なくすることができる
ものである。According to the structure of claim 1, when the relative speed is equal to or higher than the predetermined threshold value, the sound signal is reproduced faster than during recording while maintaining the normal pitch by the time domain expansion / contraction processing, so that more sound than before can be produced. Since the signals can be reproduced at the same time, the discard rate and the maximum delay amount between the input and output signals can be made smaller than before while maintaining the same pitch as during recording.
【0024】請求項2記載の構成により、時間領域伸縮
処理によって通常の音程を保ちつつ記録時より速く音響
信号を再生する、あるいは通常の音程でかつ通常の速度
で音響信号を再生することにより、従来と同等以上の音
響信号を同一時間で再生できるので、記録時と同じ音程
を保ちつつ廃棄率および入出力信号間の最大遅延量を従
来以下にすることができるものである。According to the structure of claim 2, by reproducing the acoustic signal faster than during recording while maintaining the normal pitch by the time domain expansion / contraction processing, or by reproducing the acoustic signal at the normal pitch and at the normal speed. Since it is possible to reproduce an acoustic signal equal to or higher than the conventional one in the same time, the discard rate and the maximum delay amount between the input and output signals can be reduced to the conventional level or lower while maintaining the same pitch as during recording.
【0025】請求項3記載の方法により、(数7)で与
えられる圧縮比Scで時間領域圧縮することによって、通
常の音程で、かつ、速度Rsの速度で再生した音響信号を
得ることができ、記録時と同じ音程を保ちつつ廃棄率お
よび入出力信号間の最大遅延量を従来より少なくするこ
とができるものである。According to the method of claim 3, by performing time domain compression with the compression ratio Sc given by (Equation 7), it is possible to obtain an acoustic signal reproduced at a normal pitch and a speed of Rs. The discard rate and the maximum amount of delay between input and output signals can be reduced while maintaining the same pitch as during recording.
【0026】請求項4記載の方法により、(数8)で与
えられる圧縮比Scで時間領域圧縮することによって、通
常の音程で、かつ、相対速度Rtの値に応じた速度Rs(k)
(k=1,2,...,n)の速度で再生した音響信号を得ることが
でき、記録時と同じ音程を保ちつつ廃棄率および入出力
信号間の最大遅延量を従来より少なくすることができる
ものである。According to the method of claim 4, by performing time domain compression with the compression ratio Sc given by (Equation 8), the velocity Rs (k) is in the normal pitch and according to the value of the relative velocity Rt.
It is possible to obtain an acoustic signal reproduced at a speed of (k = 1,2, ..., n), and reduce the discard rate and the maximum delay between input and output signals while maintaining the same pitch as during recording. Is something that can be done.
【0027】請求項5記載の方法により、(数9)で与
えられる圧縮比Scで時間領域圧縮することによって、高
速再生する速度が閾値Rsの値より小さい相対速度Rtの場
合にはすべての音響信号を利用して時間領域圧縮を行
い、閾値Rsの値より大きい相対速度Rtの場合には入力さ
れた音響信号の一部分を廃棄して時間領域圧縮すること
で、通常の音程で、かつ、記録時より速く相対速度Rt以
下の速度で再生した音響信号を得ることができ、記録時
と同じ音程を保ちつつ廃棄率および入出力信号間の最大
遅延量を従来より少なくすることができるものである。By performing time domain compression with the compression ratio Sc given by (Equation 9) according to the method of claim 5, all the sound is reproduced when the speed for high speed reproduction is the relative speed Rt smaller than the value of the threshold value Rs. Performs time domain compression using the signal, and when the relative velocity Rt is greater than the threshold value Rs, discards a portion of the input acoustic signal and performs time domain compression to record at normal pitch and record. It is possible to obtain an acoustic signal reproduced at a speed less than the relative speed Rt faster than time, and to reduce the discard rate and the maximum delay amount between input and output signals while maintaining the same pitch as during recording. ..
【0028】[0028]
【実施例】以下本発明の第1の実施例について、図面を
参照しながら説明する。DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS A first embodiment of the present invention will be described below with reference to the drawings.
【0029】図1は本発明の第1の実施例における音声
再生装置の構成図を示したものである。図1において、
201は信号再生手段、202はAD変換器、203は
ディジタルメモリ、204はDA変換器、205はクロ
ックレート設定手段、10は時間領域伸縮処理手段、1
1はメモリ制御手段、12は圧縮比設定手段、13は比
較手段である。このうち、201、202、203、2
04、205については従来例と同様の構成要素であ
る。FIG. 1 shows a block diagram of an audio reproducing apparatus in a first embodiment of the present invention. In FIG.
Reference numeral 201 is a signal reproduction means, 202 is an AD converter, 203 is a digital memory, 204 is a DA converter, 205 is a clock rate setting means, 10 is a time domain expansion / contraction processing means, 1
Reference numeral 1 is a memory control means, 12 is a compression ratio setting means, and 13 is a comparison means. Of these, 201, 202, 203, 2
The components 04 and 205 are the same as those of the conventional example.
【0030】本実施例では、高速再生する相対速度Rtと
与えられた速度の閾値Rsをもとに処理内容が変更され
る。まず、圧縮比の定義であるがこれは時間領域伸縮
(= TimeScale Modification、以下TSMと記す)する
入力信号とその出力信号との時間長比で定義する。従っ
て、以下に述べる音声再生装置では高速再生時の処理に
ついてのみ述べているので、圧縮比は常に1.0より大き
い値になる。TSM処理については例えば「ディジタル
音声処理」(122ページ〜124ページ、古井貞煕
著、東海大学出版会)などに述べられている。従来例と
ほぼ同様に信号再生手段201、AD変換器202、デ
ィジタルメモリ203、クロックレート設定手段205
を動作させることにより、記録時より高速のサンプリン
グ周期 Tn/Rtでサンプリングされた音響信号がディジタ
ルメモリ203に記憶されている。時間領域伸縮処理手
段10はディジタルメモリ203の出力信号を圧縮比設
定手段12によって与えられる圧縮比Scによって時間領
域圧縮する。比較手段13は、相対速度Rtと速度の閾値
Rsとを比較し、RtがRsより大きいときには圧縮比を1/
Rsに設定してメモリ制御手段11の動作と圧縮比設定手
段12の設定値を制御する。In this embodiment, the processing content is changed based on the relative speed Rt for high speed reproduction and the given speed threshold Rs. First, regarding the definition of the compression ratio, this is defined by the time length ratio between the input signal that undergoes time domain modification (= Time Scale Modification, hereinafter referred to as TSM) and its output signal. Therefore, in the audio reproducing apparatus described below, only the processing at the time of high-speed reproduction is described, so that the compression ratio is always larger than 1.0. The TSM processing is described in, for example, "Digital Audio Processing" (pages 122 to 124, Sadahiro Furui, Tokai University Press). The signal reproducing means 201, the AD converter 202, the digital memory 203, and the clock rate setting means 205 are almost the same as the conventional example.
Is operated, the acoustic signal sampled at the sampling cycle Tn / Rt which is faster than that at the time of recording is stored in the digital memory 203. The time domain expansion / contraction processing means 10 compresses the output signal of the digital memory 203 in the time domain according to the compression ratio Sc given by the compression ratio setting means 12. The comparison means 13 determines the relative speed Rt and the speed threshold value.
Rs is compared, and when Rt is larger than Rs, the compression ratio is 1 /
Setting to Rs controls the operation of the memory control means 11 and the set value of the compression ratio setting means 12.
【0031】次に、高速再生時に如何にデータが出力さ
れるかを模式図を用いて説明する。図2は、第1の実施
例における相対速度が2、および、5の場合のデータ処
理の模式図を示している。本実施例では、閾値Rsが2.
0、すなわち記録速度に対する相対速度が2.0以上の場合
に圧縮比0.5の時間領域圧縮処理を行うことを仮定して
いる。相対速度2の場合において、図2(b)は未処理デ
ータであり、(c)は処理後のデータである。また、相対
速度5の場合において、図2(d)は未処理データであ
り、(e)は処理後のデータである。同図より明らかなよ
うに相対速度2の場合にはすべてのデータを利用して出
力を演算している。本実施例におけるデータの廃棄率Ra
1は一般に次式のように表される。Next, how data is output during high speed reproduction will be described with reference to a schematic diagram. FIG. 2 is a schematic diagram of data processing when the relative speed is 2 and 5 in the first embodiment. In this embodiment, the threshold Rs is 2.
It is assumed that the time domain compression process with a compression ratio of 0.5 is performed when the relative speed to the recording speed is 2.0 or more, that is, 2.0 or more. In the case of the relative speed 2, FIG. 2B is unprocessed data and FIG. 2C is processed data. Further, in the case of the relative speed 5, FIG. 2 (d) is the unprocessed data and (e) is the processed data. As is clear from the figure, when the relative speed is 2, the output is calculated using all the data. Data disposal rate Ra in this example
1 is generally expressed by the following equation.
【0032】[0032]
【数10】 [Equation 10]
【0033】図2(c)の例では相対速度を2、圧縮比を
0.5に設定しているので、廃棄率Ra1は(数10)により
0.0となる。図2(e)の例では相対速度を5、圧縮比を0.
5に設定しているので、廃棄率Ra1は(数10)により0.
6となる。In the example of FIG. 2 (c), the relative speed is 2 and the compression ratio is
Since it is set to 0.5, the disposal rate Ra1 is
It becomes 0.0. In the example of Fig. 2 (e), the relative speed is 5 and the compression ratio is 0.
Since it is set to 5, the disposal rate Ra1 is 0 according to (Equation 10).
6
【0034】次に本実施例における入出力信号間の最大
遅延量Td1は、次式のように表される。Next, the maximum delay amount Td1 between the input and output signals in this embodiment is expressed by the following equation.
【0035】[0035]
【数11】 [Equation 11]
【0036】Td1を計算するため、従来例と同様にTfを
3.2768[sec]、相対速度を5、とし圧縮比Scを0.5として
求めると、図2(c)の場合は0.0[sec]となり、図2(e)の
場合は9.8304[sec]となる。In order to calculate Td1, Tf is calculated as in the conventional example.
When calculated with 3.2768 [sec], a relative speed of 5, and a compression ratio Sc of 0.5, it is 0.0 [sec] in the case of FIG. 2C and 9.8304 [sec] in the case of FIG. 2E.
【0037】図3は相対速度Rtと圧縮比Sc、廃棄率Ra、
最大遅延量Tdとの関係を表した図である。相対速度が大
きいほど、廃棄率と最大遅延量が大きくなる様子がわか
る。FIG. 3 shows the relative speed Rt, the compression ratio Sc, the discard rate Ra,
It is a figure showing the relationship with the maximum delay amount Td. It can be seen that the larger the relative speed, the larger the discard rate and the maximum delay amount.
【0038】以上のように本実施例によれば、記録時と
同じ音程を保ちつつ廃棄率Ra1および最大遅延量Td1のい
ずれも従来例より小さい値にした再生音を得られること
が容易に理解される。As described above, according to the present embodiment, it is easily understood that the reproduced sound can be obtained in which both the discard rate Ra1 and the maximum delay amount Td1 are smaller than those in the conventional example while maintaining the same pitch as during recording. To be done.
【0039】なお、本実施例では従来例と同様にVTR
やカセットテープレコーダなどの磁気記録媒体へ記録さ
れた音響信号情報に適用するように記載しているが、記
録媒体が半導体メモリや光ディスク等であっても構わな
い。In the present embodiment, the VTR is the same as the conventional example.
However, the recording medium may be a semiconductor memory, an optical disk, or the like, although it is described as being applied to acoustic signal information recorded on a magnetic recording medium such as a cassette tape recorder.
【0040】以下本発明の第2の実施例について、図面
を参照しながら説明する。図4は本発明の第2の実施例
における音声再生装置の構成図を示したものである。図
4において、201は信号再生手段、202はAD変換
器、203はディジタルメモリ、204はDA変換器、
205はクロックレート設定手段、10は時間領域伸縮
処理手段、11はメモリ制御手段、12は圧縮比設定手
段、20はモード制御手段、21は選択手段である。こ
のうち、201、202、203、204、205につ
いては従来例と同様の構成要素である。The second embodiment of the present invention will be described below with reference to the drawings. FIG. 4 shows a block diagram of an audio reproducing apparatus in the second embodiment of the present invention. In FIG. 4, 201 is a signal reproducing means, 202 is an AD converter, 203 is a digital memory, 204 is a DA converter,
Reference numeral 205 is a clock rate setting means, 10 is a time domain expansion / contraction processing means, 11 is a memory control means, 12 is a compression ratio setting means, 20 is a mode control means, and 21 is a selection means. Of these, 201, 202, 203, 204, and 205 are the same constituent elements as the conventional example.
【0041】本実施例では、高速再生する相対速度Rtと
与えられた圧縮比Scをもとに処理内容が変更される。従
来例とほぼ同様に信号再生手段201、AD変換器20
2、ディジタルメモリ203、クロックレート設定手段
205を動作させることにより、記録時より高速のサン
プリング周期 Tn/Rtでサンプリングされた音響信号がデ
ィジタルメモリ203に記憶されている。時間領域伸縮
処理手段10はディジタルメモリ203の出力信号を圧
縮比設定手段12によって与えられる圧縮比Scによって
時間領域圧縮する。モード制御手段20は、圧縮比Scが
1.0の場合には、時間領域圧縮をせずに従来モードで動
作させる制御を、圧縮比Scが1より大きい場合は時間領
域圧縮処理手段を用いる時間圧縮モードで動作させる制
御をメモリ制御手段11、圧縮比設定手段12、選択手
段21に対して行う。圧縮比が1より大きい場合、すな
わち、時間圧縮モードで動作させる場合には、相対速度
Rtと圧縮比Scとを比較し、Rtが1/Scより小さいときに
は圧縮比を1/Rtにし、また、Rtが1/Scより大きいと
きには圧縮比はそのままScにしてメモリ制御手段11、
圧縮比設定手段12、選択手段21を制御する。In this embodiment, the processing contents are changed based on the relative speed Rt for high speed reproduction and the given compression ratio Sc. Signal reproducing means 201 and AD converter 20 are almost the same as in the conventional example.
2. By operating the digital memory 203 and the clock rate setting means 205, the acoustic signal sampled at the sampling cycle Tn / Rt which is faster than that at the time of recording is stored in the digital memory 203. The time domain expansion / contraction processing means 10 compresses the output signal of the digital memory 203 in the time domain according to the compression ratio Sc given by the compression ratio setting means 12. The mode control means 20 determines that the compression ratio Sc
In the case of 1.0, control for operating in the conventional mode without time domain compression, and control for operating in the time compression mode using the time domain compression processing means when the compression ratio Sc is greater than 1, the memory control means 11, This is performed for the compression ratio setting means 12 and the selection means 21. When the compression ratio is greater than 1, that is, when operating in the time compression mode, the relative speed
Rt is compared with the compression ratio Sc, and when Rt is smaller than 1 / Sc, the compression ratio is set to 1 / Rt, and when Rt is larger than 1 / Sc, the compression ratio is set to Sc as it is, and the memory control means 11,
The compression ratio setting means 12 and the selection means 21 are controlled.
【0042】次に、高速再生時に如何にデータが出力さ
れるかを模式図を用いて説明する。図5は、第2の実施
例における相対速度が5の場合のデータ処理の模式図で
ある。与えられた圧縮比Scが1.0の場合、図5(c)のよう
に従来例と同様のデータ処理が行われる。一方、圧縮比
Scが1.0より小さい値の場合はTSM処理を行うので使
用されるデータ量は圧縮比Scが1.0の場合より多くな
る。図5(d)は圧縮比Scが0.5の場合における模式図を示
したものである。図において1&2と記載している領域
は、信号1と信号2を用いてTSM処理を行うことを表
すことにする。ここでは、圧縮比Scを0.5としているか
ら(c)に比べると2倍のデータ量を使用することにな
る。従って、(c)でTfの時間に信号1の部分を記録時と
同じ速度で再生する代わりに、(d)ではTfの時間に信号
1と信号2の部分を記録時と同じ音程で、かつ、2倍の
速度で再生することになる。すなわち、(d)では同じ時
間内で(c)の2倍の情報を、聴取することになる。本実
施例におけるデータの廃棄率は第1の実施例と同様に
(数10)で表される。Next, how data is output during high speed reproduction will be described with reference to a schematic diagram. FIG. 5 is a schematic diagram of data processing when the relative speed is 5 in the second embodiment. When the given compression ratio Sc is 1.0, the same data processing as the conventional example is performed as shown in FIG. On the other hand, the compression ratio
When Sc is a value smaller than 1.0, the TSM processing is performed, so the amount of data used is larger than when the compression ratio Sc is 1.0. FIG. 5D shows a schematic diagram when the compression ratio Sc is 0.5. In the figure, the area described as 1 & 2 represents that the TSM processing is performed using the signal 1 and the signal 2. Here, since the compression ratio Sc is set to 0.5, twice the data amount is used as compared with (c). Therefore, in (c), instead of playing the portion of signal 1 at the time of Tf at the same speed as when recording, at (d) the portion of signal 1 and signal 2 at the time of Tf has the same pitch as that at the time of recording, and It will be played back at twice the speed. That is, in (d), twice as much information as in (c) is heard within the same time. The data discard rate in this embodiment is expressed by (Equation 10) as in the first embodiment.
【0043】図5(d)の例では相対速度を5、圧縮比を
0.5に設定しているので、廃棄率Ra1は(数10)により
0.6となる。相対速度が大きいほど、あるいは、圧縮比
の値が1に近い値を取るほど、廃棄率Ra1は大きくな
る。図5(c)は従来例と同じ廃棄率で0.8となる。In the example of FIG. 5D, the relative speed is 5, and the compression ratio is
Since it is set to 0.5, the disposal rate Ra1 is
It becomes 0.6. The larger the relative speed, or the closer the compression ratio value is to 1, the larger the discard rate Ra1. In FIG. 5 (c), the disposal rate is 0.8, which is the same as the conventional example.
【0044】次に本実施例の装置における入出力信号間
の最大遅延量Td1は第1の実施例と同様に(数11)の
ように表される。Next, the maximum delay amount Td1 between the input and output signals in the device of this embodiment is expressed as in (Equation 11) as in the first embodiment.
【0045】従来例と同様にTfを3.2768[sec]、相対速
度を5、とし圧縮比Scを0.5として図5(d)の例の最大遅
延量Td1を求めると、9.8304[sec]となる。図5(c)の例
は従来例と同様に13.08[sec]となる。Similar to the conventional example, when Tf is 3.2768 [sec], the relative speed is 5, and the compression ratio Sc is 0.5, the maximum delay amount Td1 in the example of FIG. 5D is calculated to be 9.8304 [sec]. The example of FIG. 5 (c) is 13.08 [sec] as in the conventional example.
【0046】以上のように本実施例によれば、従来方式
と同様の再生だけでなく、記録時と同じ音程を保ちつつ
廃棄率Ra1および最大遅延量Td1のいずれも従来例と同じ
あるいは小さい値にした再生音を得られることが容易に
理解される。As described above, according to the present embodiment, not only the same reproduction as in the conventional method but also the discard rate Ra1 and the maximum delay amount Td1 are the same or smaller than those in the conventional example while maintaining the same pitch as during recording. It is easily understood that the reproduced sound can be obtained.
【0047】なお、本実施例では従来例と同様にVTR
やカセットテープレコーダなどの磁気記録媒体へ記録さ
れた音響信号情報に適用するように記載しているが、記
録媒体が半導体メモリや光ディスク等であっても構わな
い。In this embodiment, the VTR is the same as the conventional example.
However, the recording medium may be a semiconductor memory, an optical disk, or the like, although it is described as being applied to acoustic signal information recorded on a magnetic recording medium such as a cassette tape recorder.
【0048】以下本発明の第3の実施例について、図面
を参照しながら説明する。図6は本発明の第3の実施例
における音声再生方法のフローチャートを示したもので
ある。以下にその説明を行う。The third embodiment of the present invention will be described below with reference to the drawings. FIG. 6 shows a flow chart of the audio reproducing method in the third embodiment of the present invention. The description will be given below.
【0049】音響信号を記録している記録媒体が磁気記
録媒体の時には一時的に音響信号をバッファとしてRA
Mに記録する必要があるが、半導体メモリを記録媒体に
している場合には、そのまま以下の処理を行えば良い。
すなわち、磁気記録媒体等の場合にはRAMへの音響信
号の書き込みを行いつつ、これとは別に以下の処理を行
う必要がある。本実施例では、サンプリング周期Tnでデ
ィジタル化された音響信号が以下の処理を行うに十分な
数だけすでにランダムアクセスメモリ(以下RAMと記
す)に記憶されているものとする。すなわち、時間領域
圧縮を行うことができるだけのデータ量がすでにRAM
上に存在していることが必要条件となる。When the recording medium for recording the acoustic signal is a magnetic recording medium, the acoustic signal is temporarily used as a buffer for RA.
It is necessary to record in M, but when a semiconductor memory is used as a recording medium, the following processing may be performed as it is.
That is, in the case of a magnetic recording medium or the like, it is necessary to perform the following processing separately from the writing of the acoustic signal in the RAM. In this embodiment, it is assumed that a sufficient number of acoustic signals digitized at the sampling period Tn are already stored in the random access memory (hereinafter referred to as RAM) to perform the following processing. That is, the amount of data that can be compressed in the time domain is already in the RAM.
Existence above is a requirement.
【0050】次に記号の定義を示す。これから再生しよ
うとするメモリの先頭アドレスを示すポインタをPとす
る。音響信号はポインタPから連続して記録されている
ものとする。このデータ列に対し、再生出力はNf個単位
をフレームとして処理後に出力され、これを繰り返すも
のとする。Na(0<Na≦Nf)は時間領域圧縮を行って出力
するデータの個数を、Nb(0≦Nb<Nf)は無音を出力する
データの個数を示す。ここで、NfはNaとNbの和に等しく
なる。記録時との相対速度がRtで高速再生を行うとする
と、記録時にNf個のデータを再生する時間に高速再生時
にはRt・Nf個のデータを消費する必要がある。Next, the definition of symbols is shown. Let P be a pointer indicating the start address of the memory to be reproduced. It is assumed that the acoustic signal is continuously recorded from the pointer P. For this data string, the reproduction output is output after processing with Nf units as frames, and this is repeated. Na (0 <Na ≦ Nf) indicates the number of data to be output after time domain compression, and Nb (0 ≦ Nb <Nf) indicates the number of data to output silence. Here, Nf is equal to the sum of Na and Nb. If high-speed reproduction is performed at a relative speed of Rt with respect to recording, it is necessary to consume Rt · Nf data during high-speed reproduction during the time of reproducing Nf data during recording.
【0051】以下、図6のフローチャートに沿って説明
を行う。まず、初期設定として Rt,Nf,Na,Nbの値を決定
する。そして、Rtの値に応じて時間圧縮する圧縮比Scを
求める。ここでは(数8)で表される例として以下の式
に従う場合について説明を行う。The description will be given below with reference to the flowchart of FIG. First, the values of Rt, Nf, Na, and Nb are determined as initial settings. Then, the compression ratio Sc for time compression is obtained according to the value of Rt. Here, as an example represented by (Equation 8), a case of following the following equation will be described.
【0052】[0052]
【数12】 [Equation 12]
【0053】以下は、1フレームの処理、すなわち、繰
り返して処理を行う部分である。 (a)ポインタP以後のデータに対して(数12)で与え
られる圧縮比Scで時間領域圧縮を行ってNa個データを出
力する。The following is the processing for one frame, that is, the portion for repeatedly performing the processing. (a) The data after the pointer P is time-domain compressed at the compression ratio Sc given by (Equation 12), and Na data is output.
【0054】(b)Nb個の無音データを出力する。この処
理は、フレーム間が不連続に接続されるときに強制的に
無音を挿入する場合に適用される。(B) Output Nb silent data. This processing is applied when forcibly inserting silence when frames are connected discontinuously.
【0055】(c)ポインタPの示すアドレスをRt・Nfだけ
増加させて、次の処理に備える。さらに処理を続ける場
合には(a)〜(c)の処理を繰り返して行う。(C) The address indicated by the pointer P is increased by Rt · Nf to prepare for the next processing. To continue the process, the processes (a) to (c) are repeated.
【0056】次に、高速再生時に如何にデータが出力さ
れるかを模式図を用いて説明する。図7は、第3の実施
例における相対速度が2、3、および、5の場合のデー
タ処理の模式図を示している。本実施例では、閾値Rs
(1)が2.0、すなわち記録速度に対する相対速度が2.0以
上の場合の処理を行うことを仮定している。圧縮比Scは
(数12 9)に示すように相対速度が2以上3未満の
時に1/2、相対速度が3以上4未満の時に1/3、相
対速度が4以上の時には1/4と、相対速度の値により
設定を変更する。相対速度2の場合、図7(b)は未処理
データであり、(c)は処理後のデータである。相対速度
3の場合、図7(d)は未処理データであり、(e)は処理後
のデータである。また、相対速度5の場合、図7(f)は
未処理データであり、(g)は処理後のデータである。同
図より明らかなように相対速度2あるいは3の場合には
すべてのデータを利用して出力を演算している。これに
対して相対速度が5の場合には一部を廃棄している。本
実施例におけるデータの廃棄率Raは、次式のように表さ
れる。Next, how data is output during high-speed reproduction will be described with reference to schematic diagrams. FIG. 7 shows a schematic diagram of data processing when the relative speeds are 2, 3, and 5 in the third embodiment. In this embodiment, the threshold Rs
It is assumed that the processing is performed when (1) is 2.0, that is, the relative speed to the recording speed is 2.0 or more. As shown in (Equation 129), the compression ratio Sc is 1/2 when the relative speed is 2 or more and less than 3, 1/3 when the relative speed is 3 or more and less than 4, and 1/4 when the relative speed is 4 or more. , Change the setting according to the relative speed value. In the case of the relative speed 2, FIG. 7B shows unprocessed data and FIG. 7C shows processed data. In the case of the relative speed 3, FIG. 7D shows unprocessed data, and FIG. 7E shows processed data. Further, in the case of the relative speed 5, FIG. 7 (f) is the unprocessed data and (g) is the processed data. As is clear from the figure, when the relative speed is 2 or 3, the output is calculated using all the data. On the other hand, when the relative speed is 5, a part is discarded. The data discard rate Ra in the present embodiment is expressed by the following equation.
【0057】[0057]
【数13】 [Equation 13]
【0058】図7(c)および(e)の例では相対速度を2お
よび3に設定しているので、廃棄率Raはいずれも0.0と
なる。図7(g)の例では相対速度を5に設定しているの
で、廃棄率Raは0.2となる。相対速度と閾値との位置関
係により廃棄率は不連続に変動する。廃棄率Raを(数
8)に基づいて一般的に書き表すと以下のようになる。Since the relative speeds are set to 2 and 3 in the examples of FIGS. 7C and 7E, the discard rate Ra is 0.0. In the example of FIG. 7 (g), since the relative speed is set to 5, the discard rate Ra is 0.2. The discard rate varies discontinuously due to the positional relationship between the relative speed and the threshold value. The waste rate Ra is generally expressed as follows based on (Equation 8).
【0059】[0059]
【数14】 [Equation 14]
【0060】次に本実施例における入出力信号間の最大
遅延量Tdは、次式のように表される。Next, the maximum delay amount Td between the input and output signals in this embodiment is expressed by the following equation.
【0061】[0061]
【数15】 [Equation 15]
【0062】Tdを計算するため、従来例と同様にTfを3.
2768[sec]とすると、図7(c)および(e)の場合は0.0[se
c]となり、図7(g)の場合は3.2768[sec]となる。最大遅
延量も相対速度と閾値との位置関係により不連続に変動
する。最大遅延量Tdを(数8)に基づいて一般的に書き
表すと以下のようになる。In order to calculate Td, Tf is set to 3.
2768 [sec], 0.0 [se] in the case of Fig. 7 (c) and (e)
c], which is 3.2768 [sec] in the case of FIG. 7 (g). The maximum delay amount also changes discontinuously depending on the positional relationship between the relative speed and the threshold value. The maximum delay amount Td is generally expressed as follows based on (Equation 8).
【0063】[0063]
【数16】 [Equation 16]
【0064】図8は本実施例における相対速度Rtと圧縮
比Sc、廃棄率Ra、および最大遅延量Tdとの関係を示した
ものである。図13の従来例の場合と比較すると違いが
良くわかる。FIG. 8 shows the relationship between the relative speed Rt, the compression ratio Sc, the discard rate Ra, and the maximum delay amount Td in this embodiment. The difference can be clearly seen in comparison with the case of the conventional example of FIG.
【0065】以上のように本実施例によれば、廃棄率Ra
および最大遅延量Tdのいずれも従来例より小さい値にし
た再生音を得られることが容易に理解される。As described above, according to this embodiment, the waste rate Ra
It is easily understood that the reproduced sound can be obtained with both the maximum delay amount Td and the maximum delay amount Td being smaller than the conventional example.
【0066】次に(数9)で表される例として、圧縮比
Scが以下の式に従う場合について説明を行う。Next, as an example represented by (Equation 9), the compression ratio
The case where Sc follows the following formula is explained.
【0067】[0067]
【数17】 [Equation 17]
【0068】(数17)で示した圧縮比を与える場合に
は、相対速度が2未満の場合には入力される音響信号の
すべてを用いる時間領域圧縮を行い、それ以上の場合に
は圧縮比は固定の時間圧縮を行う。この場合の廃棄率
は、次式のようにあらわせる。When the compression ratio shown in (Equation 17) is given, when the relative velocity is less than 2, time domain compression using all the input acoustic signals is performed, and when it is more than that, the compression ratio is obtained. Performs a fixed time compression. The disposal rate in this case is expressed as the following equation.
【0069】[0069]
【数18】 [Equation 18]
【0070】そして、(数9)で表される圧縮比をもと
に一般的に廃棄率を書き表すと以下のようになる。Then, the discard rate is generally written based on the compression ratio represented by (Equation 9) as follows.
【0071】[0071]
【数19】 [Formula 19]
【0072】また、最大遅延量は次式のようになる。The maximum delay amount is given by the following equation.
【0073】[0073]
【数20】 [Equation 20]
【0074】そして、(数9)で表される圧縮比をもと
に一般的に最大遅延量を書き表すと以下のようになる。Then, the maximum delay amount is generally written as follows based on the compression ratio represented by (Equation 9).
【0075】[0075]
【数21】 [Equation 21]
【0076】この例の場合の相対速度Rtと圧縮比Sc、廃
棄率Raおよび最大遅延量Tdの関係は図9のようになる。The relationship between the relative speed Rt, the compression ratio Sc, the discard rate Ra and the maximum delay amount Td in the case of this example is as shown in FIG.
【0077】以上のように本実施例によれば、廃棄率Ra
3および最大遅延量Td3のいずれも従来例より小さい値に
した再生音を得られることが容易に理解される。As described above, according to this embodiment, the waste rate Ra
It is easily understood that the reproduced sound having a value smaller than that of the conventional example can be obtained for both 3 and the maximum delay amount Td3.
【0078】次に(数22)で表される例として、圧縮
比Scが以下の式に従う場合について説明を行う。Next, as an example represented by (Equation 22), a case where the compression ratio Sc follows the following equation will be described.
【0079】[0079]
【数22】 [Equation 22]
【0080】[0080]
【数23】 [Equation 23]
【0081】(数23)で示した圧縮比を与える場合に
は、相対速度が2未満の場合には入力される音響信号の
すべてを用いる時間領域圧縮を行い、それ以上の場合に
は圧縮比は固定の時間圧縮を行う。この場合の廃棄率
は、次式のようにあらわせる。When the compression ratio shown in (Equation 23) is given, when the relative velocity is less than 2, time domain compression using all the input acoustic signals is performed, and when it is more than that, the compression ratio is obtained. Performs a fixed time compression. The disposal rate in this case is expressed as the following equation.
【0082】[0082]
【数24】 [Equation 24]
【0083】そして、(数22)で表される圧縮比をも
とに一般的に廃棄率を書き表すと以下のようになる。Then, the discard rate is generally written based on the compression ratio represented by (Equation 22) as follows.
【0084】[0084]
【数25】 [Equation 25]
【0085】また、最大遅延量は次式のようになる。The maximum delay amount is given by the following equation.
【0086】[0086]
【数26】 [Equation 26]
【0087】そして、(数22)で表される圧縮比をも
とに一般的に最大遅延量を書き表すと以下のようにな
る。Then, the maximum delay amount is generally written as follows based on the compression ratio represented by (Equation 22).
【0088】[0088]
【数27】 [Equation 27]
【0089】この例の場合の相対速度Rtと圧縮比Sc、廃
棄率Raおよび最大遅延量Tdの関係は図10のようにな
る。The relationship between the relative speed Rt, the compression ratio Sc, the discard rate Ra and the maximum delay amount Td in the case of this example is as shown in FIG.
【0090】以上のように本実施例によれば、廃棄率Ra
4および最大遅延量Td4のいずれも従来例より小さい値に
した再生音を得られることが容易に理解される。As described above, according to this embodiment, the waste rate Ra
It can be easily understood that the reproduced sound having a value smaller than that of the conventional example can be obtained for both 4 and the maximum delay amount Td4.
【0091】[0091]
【発明の効果】本発明の音声再生装置は、圧縮比設定手
段で与えられる圧縮比で時間領域伸縮を行う時間領域伸
縮処理手段を設けたことにより、通常の音程を保ちつつ
記録時より速く音響信号を再生でき、廃棄率および最大
遅延量を同等以下に低減できるものである。従って、V
TRなどで音響信号をもとにしたサーチを行うときでも
再生内容の抜け、および、時間のずれが従来より少なく
設定できる。そして、通常速度のまま再生する選択も可
能となる。圧縮比を変更する閾値を可変することで動作
を変更することも可能である。これは、例えば記録され
ている内容が難解な音声などでは再生速度が2倍を越え
ると再生内容を理解できなくなることがあるが、本発明
では閾値を変更するのみで速度を可変できる。また、本
発明の音声再生方法では、フレーム間の不連続感を低減
する目的で無音データを挿入することも可能としてい
る。The audio reproducing apparatus of the present invention is provided with the time domain expansion / contraction processing means for expanding / compressing the time domain at the compression ratio given by the compression ratio setting means, so that the sound is reproduced faster than during recording while maintaining the normal pitch. The signal can be reproduced, and the discard rate and the maximum delay amount can be reduced to the same level or less. Therefore, V
Even when performing a search based on an audio signal in TR or the like, it is possible to set the content of reproduction and the time lag to be smaller than in the conventional case. Then, it becomes possible to select reproduction at the normal speed. It is also possible to change the operation by changing the threshold value for changing the compression ratio. This is because, for example, in the case of voice whose contents are difficult to understand, if the reproduction speed exceeds twice, the reproduced contents may not be understood, but in the present invention, the speed can be changed only by changing the threshold value. Further, in the audio reproducing method of the present invention, silent data can be inserted for the purpose of reducing discontinuity between frames.
【図1】本発明の第1の実施例の構成図FIG. 1 is a configuration diagram of a first embodiment of the present invention.
【図2】本発明の第1の実施例におけるデータ処理の模
式図FIG. 2 is a schematic diagram of data processing in the first embodiment of the present invention.
【図3】本発明の第1の実施例における相対速度と圧縮
比、廃棄率および最大遅延量の関係を示す特性図FIG. 3 is a characteristic diagram showing the relationship between the relative speed, the compression ratio, the discard rate, and the maximum delay amount in the first embodiment of the present invention.
【図4】本発明の第2の実施例の構成図FIG. 4 is a configuration diagram of a second embodiment of the present invention.
【図5】本発明の第2の実施例におけるデータ処理の模
式図FIG. 5 is a schematic diagram of data processing in the second embodiment of the present invention.
【図6】本発明の第3の実施例における処理概要を示す
フローチャートFIG. 6 is a flowchart showing an outline of processing in the third embodiment of the present invention.
【図7】本発明の第3の実施例におけるデータ処理の模
式図FIG. 7 is a schematic diagram of data processing in the third embodiment of the present invention.
【図8】本発明の第3の実施例における相対速度と圧縮
比、廃棄率および最大遅延量の関係を示す特性図FIG. 8 is a characteristic diagram showing the relationship between the relative speed, the compression ratio, the discard rate, and the maximum delay amount in the third embodiment of the present invention.
【図9】本発明の第3の実施例における相対速度と圧縮
比、廃棄率および最大遅延量の関係を示す特性図FIG. 9 is a characteristic diagram showing the relationship between the relative speed, the compression ratio, the discard rate, and the maximum delay amount in the third embodiment of the present invention.
【図10】本発明の第3の実施例における相対速度と圧
縮比、廃棄率および最大遅延量の関係を示す特性図FIG. 10 is a characteristic diagram showing the relationship between the relative speed, the compression ratio, the discard rate, and the maximum delay amount in the third embodiment of the present invention.
【図11】従来例の構成図FIG. 11 is a configuration diagram of a conventional example.
【図12】従来例のデータ処理の模式図FIG. 12 is a schematic diagram of conventional data processing.
【図13】従来例における相対速度と圧縮比、廃棄率お
よび最大遅延量の関係を示す特性図FIG. 13 is a characteristic diagram showing the relationship between the relative speed, the compression ratio, the discard rate, and the maximum delay amount in the conventional example.
10 時間領域伸縮処理手段 11 メモリ制御手段 12 圧縮比設定手段 13 比較手段 20 モード制御手段 21 選択手段 201 信号再生手段 202 AD変換器 203 ディジタルメモリ 204 DA変換器 205 クロックレート設定手段 10 time domain expansion / contraction processing means 11 memory control means 12 compression ratio setting means 13 comparing means 20 mode control means 21 selecting means 201 signal reproducing means 202 AD converter 203 digital memory 204 DA converter 205 clock rate setting means
Claims (6)
値Rs以上である記録時との相対速度Rt(Rt>Rs≧1)で高
速に読みだす信号再生手段と、読みだした音響信号をデ
ィジタル信号に変換するAD変換器と、前記AD変換器
のサンプリング周期をTn/Rtに設定するクロックレート
設定手段と、前記AD変換器の出力をメモリ制御手段の
制御により記憶するディジタルメモリと、前記ディジタ
ルメモリから読み出したディジタル信号を圧縮比設定手
段で与えられる圧縮比で時間領域伸縮を行う時間領域伸
縮処理手段と、前記時間領域伸縮処理手段の出力をサン
プリング周期Tnでアナログ信号に変換するDA変換器
と、前記相対速度Rtの値と閾値Rsとを比較して圧縮比の
値を求める比較器と、前記比較器の出力に基づいて前記
ディジタルメモリへデータの書き込みおよび読み出しの
制御を行う前記メモリ制御手段と、前記比較器の出力に
基づいて前記時間領域伸縮処理手段の圧縮比を設定する
前記圧縮比設定手段とを有し、高速再生した音響信号を
記録時の音程でかつ、記録時のRs倍の速度で再生する制
御を行うことを特徴とする音声再生装置。1. A signal reproducing means for reading out an acoustic signal recorded on a recording medium at a high speed at a relative speed Rt (Rt> Rs ≧ 1) relative to a recording time which is a predetermined threshold value Rs or more, and an acoustic signal read out. To an digital signal, a clock rate setting means for setting the sampling period of the AD converter to Tn / Rt, a digital memory for storing the output of the AD converter under the control of the memory control means, Time domain expansion / contraction processing means for expanding / compressing the digital signal read from the digital memory at the compression ratio given by the compression ratio setting means, and DA for converting the output of the time domain expansion / compression processing means into an analog signal at the sampling cycle Tn. A converter, a comparator for comparing the value of the relative speed Rt and the threshold value Rs to obtain the value of the compression ratio, and the data to the digital memory based on the output of the comparator. The memory control means for controlling the writing and reading, and the compression ratio setting means for setting the compression ratio of the time domain expansion / contraction processing means based on the output of the comparator, An audio reproducing device characterized by performing control so that reproduction is performed at a pitch during recording and at a speed that is Rs times that during recording.
の相対速度Rt(Rt≧1)で高速に読みだす信号再生手段
と、読みだした音響信号をディジタル信号に変換するA
D変換器と、前記AD変換器のサンプリング周期をTn/
Rtに設定するクロックレート設定手段と、前記AD変換
器の出力をメモリ制御手段の制御により記憶するディジ
タルメモリと、前記ディジタルメモリから読み出したデ
ィジタル信号を圧縮比設定手段で与えられる圧縮比で時
間領域伸縮を行う時間領域伸縮処理手段と、サンプリン
グ周期Tnでアナログ信号に変換するDA変換器と、前記
相対速度Rtの値と圧縮比とを考慮して前記メモリ制御手
段、前記圧縮比設定手段および選択手段の動作モードを
決定し、時間領域伸縮すべき圧縮比の値を求めるモード
制御手段と、前記時間領域伸縮処理手段の出力あるいは
前記ディジタルメモリの出力を前記モード制御手段が与
える動作モードにより選択して前記DA変換器へ出力す
る前記選択手段と、前記モード制御手段の出力に基づい
て前記ディジタルメモリへデータの書き込みおよび読み
出しの制御を行う前記メモリ制御手段と、前記モード制
御手段の出力に基づいて前記時間領域伸縮処理手段の圧
縮比を設定する前記圧縮比設定手段とを有し、高速再生
した音響信号を記録時の音程でかつ、記録時と同一もし
くは早い速度で再生する制御を行うことを特徴とする音
声再生装置。2. A signal reproducing means for reading an acoustic signal recorded on a recording medium at a high speed at a relative speed Rt (Rt ≧ 1) to that at the time of recording, and A for converting the read acoustic signal into a digital signal.
The sampling period of the D converter and the AD converter is Tn /
A clock rate setting means for setting to Rt, a digital memory for storing the output of the AD converter under the control of the memory control means, and a digital signal read from the digital memory at a compression ratio given by the compression ratio setting means in the time domain. Time domain expansion / contraction processing means for expansion / contraction, DA converter for converting into an analog signal at a sampling cycle Tn, the memory control means, the compression ratio setting means and selection in consideration of the value of the relative speed Rt and the compression ratio. The mode control means for determining the operation mode of the means and obtaining the value of the compression ratio to be expanded / contracted in the time domain, and the output of the time domain expansion / compression processing means or the output of the digital memory are selected according to the operation mode given by the mode control means. Based on the output of the selecting means for outputting to the DA converter and the mode control means. High-speed reproduction having the memory control means for controlling writing and reading of data to and from the memory, and the compression ratio setting means for setting the compression ratio of the time domain expansion / contraction processing means based on the output of the mode control means. An audio reproducing apparatus characterized by performing control to reproduce the recorded sound signal at a pitch at the time of recording and at the same speed as or at a high speed at the time of recording.
号を、記録時との相対速度Rt(Rt>1)で高速に再生する際
に、所定の閾値Rs以上の相対速度Rtに対して圧縮比Scを
以下の式のように求め、 【数1】 再生を行うディジタルメモリの先頭アドレスを示すポイ
ンタをPとし、所定のデータ数Nf個単位で、 (a) ポインタP以後のデータに対して前記圧縮比Scで時
間領域圧縮した後にNa個(0<Na≦Nf)のデータを出力
し、 (b) Nb個(Nb=Nf-Na)の無音データを出力し、 (c) ポインタPの示すアドレスをRt・Nf増加させる 処理を繰り返して行うことで、音程は記録時と同一で、
かつ、高速に音響信号を再生することを特徴とする音声
再生方法。3. When a sound signal stored in a digital memory is reproduced at a high speed at a relative speed Rt (Rt> 1) to that at the time of recording, a compression ratio is set for a relative speed Rt equal to or higher than a predetermined threshold value Rs. Sc is calculated by the following formula, and Let P be a pointer indicating the start address of the digital memory to be played back, and (a) Na number (0 <0 (Na ≤ Nf) data is output, (b) Nb pieces (Nb = Nf-Na) of silent data are output, and (c) The address indicated by the pointer P is increased by Rt ・ Nf. , The pitch is the same as when recording,
Moreover, a sound reproducing method characterized by reproducing an acoustic signal at high speed.
値に応じて段階的に圧縮比を変化させて時間領域圧縮す
ることを特徴とする請求項3記載の音声再生方法。 【数2】 4. The audio reproducing method according to claim 3, wherein the compression ratio Sc is given by the following equation, and the compression ratio is changed stepwise according to the value of Rt to perform time domain compression. [Equation 2]
値が所定の閾値以下の場合にはRtに反比例した圧縮比で
時間領域圧縮することを特徴とする請求項3記載の音声
再生方法。 【数3】 5. The speech according to claim 3, wherein the compression ratio Sc is given by the following equation, and when the value of Rt is less than or equal to a predetermined threshold value, the compression is performed in the time domain with a compression ratio inversely proportional to Rt. How to play. [Equation 3]
値が所定の閾値以下の場合にはRtに反比例した圧縮比で
時間圧縮し、その閾値より大きいRtに対してはRtの値に
応じて段階的に圧縮比を変化させて時間領域圧縮するこ
とを特徴とする請求項3記載の音声再生方法。 【数4】 6. A compression ratio Sc is given by the following formula, and when the value of Rt is less than or equal to a predetermined threshold value, time compression is performed with a compression ratio inversely proportional to Rt. 4. The audio reproducing method according to claim 3, wherein the compression ratio is changed stepwise according to the value to perform time domain compression. [Equation 4]
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP4109459A JPH05303400A (en) | 1992-04-28 | 1992-04-28 | Method and device for audio reproduction |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP4109459A JPH05303400A (en) | 1992-04-28 | 1992-04-28 | Method and device for audio reproduction |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH05303400A true JPH05303400A (en) | 1993-11-16 |
Family
ID=14510775
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP4109459A Pending JPH05303400A (en) | 1992-04-28 | 1992-04-28 | Method and device for audio reproduction |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH05303400A (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08292798A (en) * | 1995-04-24 | 1996-11-05 | Nec Corp | Voice reproducing control method |
WO2006093195A1 (en) * | 2005-03-01 | 2006-09-08 | Matsushita Electric Industrial Co., Ltd. | Reproducing device and reproducing method |
-
1992
- 1992-04-28 JP JP4109459A patent/JPH05303400A/en active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08292798A (en) * | 1995-04-24 | 1996-11-05 | Nec Corp | Voice reproducing control method |
WO2006093195A1 (en) * | 2005-03-01 | 2006-09-08 | Matsushita Electric Industrial Co., Ltd. | Reproducing device and reproducing method |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5611018A (en) | System for controlling voice speed of an input signal | |
US20080262856A1 (en) | Method and system for enabling audio speed conversion | |
KR100739355B1 (en) | Speech processing method and apparatus | |
US6085157A (en) | Reproducing velocity converting apparatus with different speech velocity between voiced sound and unvoiced sound | |
JPS5982608A (en) | System for controlling reproducing speed of sound | |
JP3378672B2 (en) | Speech speed converter | |
JP3162945B2 (en) | Video tape recorder | |
JPH05303400A (en) | Method and device for audio reproduction | |
JP3189587B2 (en) | Audio time base converter | |
JPH09152889A (en) | Speech speed transformer | |
JP3373933B2 (en) | Speech speed converter | |
JP3357742B2 (en) | Speech speed converter | |
JP3081469B2 (en) | Speech speed converter | |
JP2000099097A (en) | Signal reproducing device and method, voice signal reproducing device, and speed conversion method for voice signal | |
JP2001222300A (en) | Voice reproducing device and recording medium | |
JPH08195028A (en) | Voice processing circuit | |
EP0702354A1 (en) | Apparatus for modifying the time scale modification of speech | |
JP2874607B2 (en) | Audio time base converter | |
JPH0573089A (en) | Speech reproducing method | |
JPH09146587A (en) | Speech speed changer | |
JPH08292796A (en) | Reproducing device | |
JPH09154107A (en) | Video and sound signal reproducing device | |
JP4529859B2 (en) | Audio playback device | |
JP2001318700A (en) | Speech speed converter | |
JP3189597B2 (en) | Audio time base converter |