JP2005266571A - Method and device for variable-speed reproduction, and program - Google Patents
Method and device for variable-speed reproduction, and program Download PDFInfo
- Publication number
- JP2005266571A JP2005266571A JP2004081498A JP2004081498A JP2005266571A JP 2005266571 A JP2005266571 A JP 2005266571A JP 2004081498 A JP2004081498 A JP 2004081498A JP 2004081498 A JP2004081498 A JP 2004081498A JP 2005266571 A JP2005266571 A JP 2005266571A
- Authority
- JP
- Japan
- Prior art keywords
- time
- audio signal
- seconds
- signal
- recording
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
Description
本発明は、音声や楽音等のオーディオ信号の音程を変えずに標準速度(記録速度)とは異なる再生速度で再生を行うような変速再生方法及び装置、並びにプログラムに関する。 The present invention relates to a variable speed reproduction method and apparatus, and a program that perform reproduction at a reproduction speed different from a standard speed (recording speed) without changing the pitch of an audio signal such as voice or musical sound.
光ディスクや磁気ディスク、磁気テープ等の記録媒体から再生するときの再生速度を、記録時の(標準の)速度とは異ならせる場合に、オーディオ信号の音程を変えることなく再生速度を変換する技術が知られている。これは、例えば、テレビジョン放送番組等をハードディスク等の記録媒体に録画し、ニュース等を早見再生したい場合に、音程が変わると聞きにくいことから、早見再生しても音程が変化しないようにすることが望まれ、このような用途に、変速再生しても音程を変えない技術が用いられるものである。 Technology that converts the playback speed without changing the pitch of the audio signal when the playback speed when playing back from a recording medium such as an optical disk, magnetic disk, or magnetic tape is different from the (standard) speed during recording. Are known. This is because, for example, when a television broadcast program or the like is recorded on a recording medium such as a hard disk and news or the like is to be played back quickly, it is difficult to hear when the pitch changes, so that the pitch does not change even when played back quickly. For this purpose, a technique that does not change the pitch even when the variable speed reproduction is used is used.
この音程を変えずに再生速度を可変する技術の一例としては、変速再生されて得られた時間領域のディジタルオーディオデータを一旦周波数領域のデータに変換し、周波数軸上で記録時の音程に戻すような処理等を行った後、再び時間領域のデータに逆変換する技術がある。このような周波数領域での処理を伴う技術においては、時間領域と周波数領域との間の変換及び逆変換のためのDCT(離散コサイン変換)、MDCT(改良DCT)、DFT(離散フーリエ変換)等の演算処理が必要とされ、処理が複雑化し、演算量も増えるため、より簡易的な技術として、非特許文献1や特許文献1に示すように、時間領域でデータ処理を行うものが知られている。これは、記録媒体から記録時異なる再生速度で再生して得られたオーディオ信号を、一定の時間毎のブロックに分割し、一のブロックの終端部分と次のブロックの先端部分とをオーバーラップさせ、各オーバーラップ部分でクロスフェード処理を行いながら連結すること(オーバーラップ加算:OLA)により、滑らかに繋ぎ合わせている。
As an example of a technique for changing the playback speed without changing the pitch, time-domain digital audio data obtained by variable speed playback is once converted into frequency-domain data and returned to the pitch at the time of recording on the frequency axis. There is a technique for performing inverse conversion to time domain data again after performing such processing. In such a technique involving processing in the frequency domain, DCT (discrete cosine transform), MDCT (improved DCT), DFT (discrete Fourier transform), etc. for transforming between time domain and frequency domain and inverse transform As a simpler technique, as shown in
すなわち、図4の(A)のような元の(記録時の)オーディオ信号に対して、記録時間軸上の第1の時間Ta毎にブロック分割し、図4の(B)に示すように、各ブロックA,B,C,・・・の端部を記録時間軸上の第2の時間Tbだけオーバーラップさせ、クロスフェード処理しながら連結する。このとき、ブロックAの終端側の時間Tbの部分rと、次のブロックBの先端側の時間Tbの部分fとがオーバーラップされ(重ね合わされ)、ブロックAの終端部分rがフェードアウト(徐々に減衰)し、次のブロックBの先端部分fがフェードイン(徐々に増大)するように、ブロックAとブロックBとが繋ぎ合わされる。このとき、オーバーラップ部分は第3の時間Tc(Tc=Ta−Tb)を繰り返し周期として繰り返し得られ、記録時間Taが時間Tcに圧縮されることになる。これによって、音程を変えることなく、記録時よりも高速のTa/Tc倍の再生速度で再生されることになる。 That is, the original (recording) audio signal as shown in FIG. 4A is divided into blocks for each first time Ta on the recording time axis, as shown in FIG. , The ends of the blocks A, B, C,... Overlap each other for a second time Tb on the recording time axis, and are connected while performing crossfade processing. At this time, the portion r of the time Tb on the end side of the block A and the portion f of the time Tb on the front end side of the next block B overlap (overlap), and the end portion r of the block A fades out (gradually). The block A and the block B are joined so that the leading end portion f of the next block B fades in (increases gradually). At this time, the overlap portion is repeatedly obtained with the third time Tc (Tc = Ta−Tb) as a repetition period, and the recording time Ta is compressed to the time Tc. As a result, playback is performed at a playback speed that is Ta / Tc times faster than that during recording without changing the pitch.
ところで、上述のように再生信号を時間領域においてブロック分割し端部をオーバーラップさせてクロスフェードしながら繋ぎ合わせるような技術においては、次のような問題点がある。 By the way, as described above, the technique in which the reproduction signal is divided into blocks in the time domain and the ends are overlapped and connected while cross-fading has the following problems.
すなわち、上記オーバーラップ部分は、元の記録時のオーディオ信号波形が重なり合うため、聴感上のゆがみとなる。全体的に良好な聴感を保つためには、分割周期とオーバーラップ部分の大きさを調整していく必要があるが、オーバーラップ部分が繰り返されることにより音程感が生じ、元の記録時のオーディオ信号に対し不快な音程差等を生じる原因となる。 In other words, the audio signal waveform at the time of original recording overlaps the above-described overlap portion, resulting in distortion in audibility. In order to maintain a good overall audibility, it is necessary to adjust the division period and the size of the overlap part. However, when the overlap part is repeated, a sense of pitch occurs, and the original recording audio This may cause an unpleasant pitch difference with respect to the signal.
また、一定の時間短縮率により、分割周期の大きさからオーバーラップ部分の大きさが必然的に決まるが、分割周期を大きくし、その結果オーバーラップ部分が大きくなると、人間の音声等では、子音が損なわれたり、発音の開始タイミングに矛盾を生じることになり、良好な音声再生が行えなくなる。 In addition, the size of the overlap part is inevitably determined from the size of the division period depending on the fixed time reduction rate, but if the division period is increased and the overlap part becomes large as a result, consonant sounds are used in human speech etc. Or the sound generation start timing becomes inconsistent, and good sound reproduction cannot be performed.
本発明は、このような従来の実情に鑑みて提案されたものであり、記録時とは異なる再生速度で再生しても音程を変えることなく、いわゆるオーバーラップ加算(OLA)のような簡易的な技術を用いながら、音声や音楽への悪影響を最小限に抑えることができるような変速再生方法及び装置、並びにプログラムを提供することを目的とする。 The present invention has been proposed in view of such a conventional situation, and does not change the pitch even when reproduced at a reproduction speed different from that at the time of recording, and is simple as in the so-called overlap addition (OLA). It is an object of the present invention to provide a variable speed reproduction method and apparatus, and a program that can minimize adverse effects on voice and music while using various technologies.
上述の課題を解決するために、本発明は、記録媒体に記録されたオーディオ信号を記録時とは異なる再生速度で再生し、再生されたオーディオ信号を記録時間軸上で分割周期としての第1の時間Taのブロックに分割し、分割された一のブロックの終端部分と次のブロックの先端部分とを記録時間軸上の第2の時間Tbでオーバーラップさせ、各オーバーラップ部分でクロスフェード処理を行うことにより連結するようにし、オーディオ信号が音声信号の場合に、上記オーバーラップ部分の繰り返し周期である第3の時間Tc(Tc=Ta−Tb)を0.05秒以上とし、上記オーバーラップ部分の第2の時間Tbを0.01秒〜0.05秒とし、オーディオ信号が音楽信号の場合に、上記分割周期である第1の時間Taを0.05秒以下とすることを特徴とする。 In order to solve the above-described problem, the present invention reproduces an audio signal recorded on a recording medium at a reproduction speed different from that at the time of recording, and the reproduced audio signal is a first divided period on the recording time axis. Are divided into blocks of time Ta, and the end portion of one divided block and the tip portion of the next block overlap at the second time Tb on the recording time axis, and crossfade processing is performed at each overlap portion. When the audio signal is an audio signal, the third time Tc (Tc = Ta−Tb), which is the repetition period of the overlap portion, is set to 0.05 seconds or more, and the overlap is performed. When the second time Tb of the portion is 0.01 seconds to 0.05 seconds and the audio signal is a music signal, the first time Ta that is the division period is 0.05 seconds or less. And wherein the Rukoto.
ここで、上記再生されたオーディオ信号が音声信号及び音楽信号を含むとき、あるいは音声信号か音楽信号かを区別できないとき、オーバーラップ部分の繰り返し周期である第3の時間Tc(Tc=Ta−Tb)を0.025秒以上とし、オーバーラップ部分の第2の時間Tbを0.005秒〜0.025秒とすることが挙げられる。 Here, when the reproduced audio signal includes an audio signal and a music signal, or when it is not possible to distinguish between the audio signal and the music signal, the third time Tc (Tc = Ta−Tb) which is the repetition period of the overlapped portion. ) Is set to 0.025 seconds or more, and the second time Tb of the overlap portion is set to 0.005 seconds to 0.025 seconds.
また、再生されたオーディオ信号が音声信号か音楽信号かを判別し、判別されたオーディオ信号の種類に応じて各時間Ta〜Tcを切り換えることが好ましい。 Further, it is preferable to determine whether the reproduced audio signal is an audio signal or a music signal, and to switch each time Ta to Tc according to the determined type of the audio signal.
また、再生速度が記録時の速度の1.3倍のとき、オーディオ信号が音声信号の場合に、オーバーラップ部分の繰り返し周期である第3の時間Tcを0.111秒とし、オーバーラップ部分の第2の時間Tbを0.033秒とし、オーディオ信号が音楽信号の場合に、分割周期である第1の時間Taを0.024秒とし、オーバーラップ部分の第2の時間Tbを0.0053秒とすることが好ましい。 When the playback speed is 1.3 times the recording speed and the audio signal is an audio signal, the third time Tc, which is the repetition period of the overlap portion, is set to 0.111 seconds, and the overlap portion In the case where the second time Tb is 0.033 seconds, and the audio signal is a music signal, the first time Ta that is a division cycle is 0.024 seconds, and the second time Tb of the overlap portion is 0.0053. Preferably it is seconds.
本発明によれば、変速再生されるオーディオ信号が音声信号の場合には、オーバーラップ部分の繰り返し周期(第3の時間)Tcを0.05秒以上とすることにより、オーバーラップ部分の繰り返しによる基本周波数成分は20Hz以下となり、人間の通常の肉声の音声信号の帯域である85Hz〜8kHzから外れているため、音声への悪影響が少なく、低域をあまり強調する必要がないBGM(バックグラウンドミュージック)に対しても影響が少ないと共に、オーバーラップ部分の時間(第2の時間)Tbを0.01秒〜0.05秒とすることにより、オーバーラップ部分をクロスフェードするときの減衰曲線が急になることによる波形歪を抑えながら、オーバーラップ部分で前後のブロックの時間関係が逆転する影響を少なくできる。また、変速再生されるオーディオ信号が音楽信号の場合には、分割周期である第1の時間Taを0.05秒以下としているため、音楽のテンポ感が良好に保たれる。さらに、変速再生されるオーディオ信号が音声信号か音楽信号か等の種類あるいはジャンルを示す属性に応じて、それぞれ適切な各時間Ta〜Tcが設定されるため、それぞれのオーディオ信号の性質を有効に保った変速再生が実現可能となる。 According to the present invention, when the audio signal to be reproduced with variable speed is an audio signal, the repetition period (third time) Tc of the overlap portion is set to 0.05 seconds or more, thereby repeating the overlap portion. Since the fundamental frequency component is 20 Hz or less and is out of the range of 85 Hz to 8 kHz, which is the normal human voice signal band, BGM (background music) that has little adverse effect on the voice and does not require much emphasis on the low frequency range. ) And the overlap portion time (second time) Tb is set to 0.01 seconds to 0.05 seconds, so that the attenuation curve when the overlap portion is crossfade is sharp. While suppressing the waveform distortion due to becoming, it is possible to reduce the influence of the time relationship of the previous and subsequent blocks in the overlapped portion is reversedFurther, when the audio signal to be played back at a variable speed is a music signal, the first time Ta, which is the division cycle, is set to 0.05 seconds or less, so that the tempo of the music is kept good. Furthermore, since each appropriate time Ta to Tc is set according to the attribute indicating the type or genre, such as whether the audio signal to be played with a variable speed is a sound signal or a music signal, the characteristics of each audio signal are effectively used. The maintained variable speed reproduction can be realized.
以下、本発明を適用した具体的な実施の形態について、図面を参照しながら詳細に説明する。 Hereinafter, specific embodiments to which the present invention is applied will be described in detail with reference to the drawings.
図1は、本発明の実施の形態に用いられる変速再生装置を概略的に示すブロック図である。この図1において、記録媒体としてのハードディスク装置11は、インターフェース(I/F)回路12を介してバス13に接続されている。このバス13には、ビデオ信号圧縮符号化/復号のための例えばMPEGエンコード/デコード回路14、オーディオ信号圧縮符号化/復号等を行うためのオーディオ処理回路21、上述したOLA(オーバーラップ加算)等を行うためのIO(入出力)プロセッサ22等が接続され、IOプロセッサ22にはバッファメモリ23が接続されている。オーディオ処理回路21からのPCM(パルスコード変調)信号や、SPDIF(Sony Philips digital interface)信号はオーディオミキサ24に送られ、オーディオミキサ24からのPCM信号はD/A変換器25でアナログ信号に変換されて端子26に送られ、オーディオミキサ24からのSPDIF信号は端子27に送られている。
FIG. 1 is a block diagram schematically showing a variable speed playback apparatus used in an embodiment of the present invention. In FIG. 1, a
図2は、上記図1の変速再生装置のオーディオ信号系をより詳細に示したブロック図であるが、オーディオ信号のみを記録再生する装置の場合には、図2の構成のみでもよく、この場合、図2は、オーディオ信号の変速再生に用いて好適な変速再生装置の一例を示すブロック図となる。 FIG. 2 is a block diagram showing the audio signal system of the variable speed reproduction apparatus of FIG. 1 in more detail. However, in the case of an apparatus for recording and reproducing only an audio signal, only the configuration of FIG. FIG. 2 is a block diagram showing an example of a variable speed reproduction apparatus suitable for variable speed reproduction of an audio signal.
この図2において、記録媒体としてのハードディスク装置11は、インターフェース(I/F)回路12に接続され、インターフェース回路12は、誤り訂正エンコード/デコード回路31及びシステムコントローラ41に接続されている。誤り訂正エンコード/デコード回路31は、音声圧縮エンコード/デコード回路32に接続されており、音声圧縮エンコード/デコード回路32からのディジタルオーディオ信号は、メモリコントローラ33を介してD/A変換器35に送られ、アナログ信号に変換されて出力端子36より取り出される。メモリコントローラ33には、バッファメモリ34が接続されている。また、入力端子38からのアナログオーディオ信号がA/D変換器37でディジタル信号に変換されて音声圧縮エンコード/デコード回路32に送られる。
In FIG. 2, a
図2のシステムコントローラ41は、マイクロコンピュータを搭載して構成されており、全体の動作を管理している。このシステムコントローラ41は、キー群42からキー入力信号が与えられる。このキー群42は、電源キー、イジェクトキー、再生キー、一時停止キー、停止キー、録音キー、早送り再生キー、早戻し再生キーなどを備える。
The system controller 41 shown in FIG. 2 is configured with a microcomputer and manages the overall operation. The system controller 41 is given a key input signal from the
また、オーディオ信号のみの変速再生装置の場合に、システムコントローラ41には、ディスプレイ43を接続することが好ましい。このディスプレイ43には、装着された小型光ディスクの総演奏時間、演奏中の曲の経過時間、再生中の曲の残り演奏時間、全体の残りの演奏時間等の時間情報や、演奏中の曲のトラックナンバ等が表示される。また、ディスクネームやトラックネームが記録されているディスクでは、ディスクネームやトラックネームが表示される。さらに、曲やディスクの記録日時が記録されていれば記録日時が表示される。
Further, in the case of a variable speed playback apparatus with only audio signals, it is preferable to connect a
なお、図1に示したように、ビデオ信号を記録再生する変速再生装置の場合には、ビデオ信号を表示するためのビデオディスプレイ装置(図示せず)が接続されるから、このビデオディスプレイ装置に上記演奏時間等の情報を表示するようにすればよく、図2の構成を図1の変速再生装置のオーディオ信号系として用いる場合には、図2のディスプレイ43は不要となる。
As shown in FIG. 1, in the case of a variable speed playback device that records and plays back a video signal, a video display device (not shown) for displaying the video signal is connected to the video display device. Information such as the performance time may be displayed. When the configuration of FIG. 2 is used as the audio signal system of the variable speed playback apparatus of FIG. 1, the
また、図2のシステムコントローラ41には、再生オーディオ信号が音声信号か、音楽信号か等の種類(ジャンル)を示す属性情報として、後述するEPG(電子プログラムガイド)のジャンル情報等を検出するEPG検出回路45が接続されている。
Further, the system controller 41 of FIG. 2 detects EPG (electronic program guide) genre information and the like as attribute information indicating the type (genre) such as whether the reproduced audio signal is a sound signal or a music signal. A
オーディオ信号の記録時には、入力端子38に供給されたアナログオーディオ信号がA/D変換器37でディジタル信号に変換され、音声圧縮エンコード/デコード回路32に送られて音声圧縮符号化処理が施され、誤り訂正エンコード/デコード回路31に送られる。誤り訂正エンコード/デコード回路31で、誤り訂正用のパリティが付加され、ハードディスク用のインターフェース回路12を介してハードディスク装置11に記録される。なお、ディジタルテレビジョン放送のように予め圧縮符号化がされたデータの場合には、そのまま、あるいは必要とされる信号処理のみを施して、インターフェース回路12を介してハードディスク装置11に記録される。
At the time of recording an audio signal, the analog audio signal supplied to the
オーディオ信号の再生時には、上記記録時と逆の処理がなされるわけであるが、特に記録時と異なる再生速度、例えば記録時よりも高速の再生速度で再生を行う場合について、以下説明する。 When an audio signal is played back, the reverse processing to that at the time of recording is performed. In particular, a case where playback is performed at a playback speed different from that at the time of recording, for example, a playback speed higher than that at the time of recording will be described below.
変速再生時に、例えば録画したテレビジョン放送番組を早見再生する場合のような高速再生時に、図2のシステムコントローラ41は、ハードディスク装置11より、通常再生時の速度(記録速度)よりも高速に、あるいは高いレートでデータを読み出し、誤り訂正エンコード/デコード回路31で誤り訂正処理を施し、音声圧縮エンコード/デコード回路32で、圧縮符号化されたオーディオ信号の伸張復号処理を施すように制御する。この音声圧縮エンコード/デコード回路32からのオーディオ信号は、時間領域の信号となっており、メモリコントローラ33を介してバッファメモリ34に一時的に記憶させている。システムコントローラ41は、バッファメモリ34からオーディオ信号を読み出す際に、上記図4の(B)に示したように、一のブロックの終端部分rと、次のブロックの先端部分fとが時間的に重なるように(オーバーラップするように)読み出して、一のブロックの終端部分rをフェードアウト(徐々に減衰)させ、次のブロックの先端部分fがフェードイン(徐々に増大)させながら、いわゆるクロスフェードさせながら、一のブロックと次のブロックとを加算混合(ミキシング)することにより、一のブロックと次のブロックとを滑らかに繋ぎ合わせている。図4の(B)では、例えばブロックBの終端部分rをフェードアウトさせ、次のブロックCの先端部分fをフェードインさせてミキシングし、ブロックBとブロックCとを滑らかに連結している。
At the time of variable speed reproduction, for example, at the time of high-speed reproduction such as when the recorded television broadcast program is quickly reproduced, the system controller 41 in FIG. 2 is faster than the speed (recording speed) during normal reproduction from the
ここで、再生されたオーディオ信号のブロック分割周期としての記録時間軸上での第1の時間をTaとし、分割された一のブロックの終端及び次のブロックの先端でのオーバーラップ部分の記録時間軸上の第2の時間をTbとするとき、オーバーラップ部分は第3の時間Tc(Tc=Ta−Tb)を周期として繰り返されることになり、記録時の第1の時間Taのデータが第3の時間Tcに圧縮されて再生されたことになる。この場合の再生速度は、記録時の速度(標準再生速度)のTa/Tc倍である。 Here, Ta is the first time on the recording time axis as the block division period of the reproduced audio signal, and the recording time of the overlapped portion at the end of one divided block and the tip of the next block When the second time on the axis is Tb, the overlap portion is repeated with the period of the third time Tc (Tc = Ta−Tb), and the data of the first time Ta at the time of recording is the first. It is compressed and reproduced at time Tc of 3. In this case, the reproduction speed is Ta / Tc times the recording speed (standard reproduction speed).
再生されるオーディオ信号が人の音声(speech sound)である場合には、上記オーバーラップ部分の繰り返し周波数(1/Tc)が、一般に有効とされる音声帯域(例えば85Hz〜8kHz)から外れていることが望ましく、また、倍音による影響も小さくしたいことを考慮し、1/Tcを20Hz以下、すなわち、第3の時間Tcを0.05秒以上とする。この場合、オーバーラップ部分の繰り返しによる基本周波数成分が20Hz以下となり、倍音の2〜3次高調波程度までは、音声帯域の下限、例えば85Hzよりも低くなるため、音声帯域に与える悪影響を極力小さく抑えることができる。また、オーバーラップ部分の長さである第2の時間Tbについては、短かすぎるとクロスフェードのための減衰曲線が急峻となり、ブロック端部のオーディオ信号波形を歪ませる影響が無視できなくなることを考慮して、0.01秒以上とし、長すぎると、前のブロックの終端で発生した音が次のブロックの先端で発生した音よりも遅れることによる時間の逆転現象が聴感上無視できなくなることを考慮し、0.05秒以下とした。このように、オーバーラップ部分の長さである第2の時間Tbを0.01秒〜0.05秒とすることにより、ブロック端部での波形の歪も少なく、オーバーラップ部分での時間の逆転現象も聴感上問題ない程度に抑えられる。なお、この音声信号の場合、ブロック分割周期である第1の時間Taは、Ta=Tc+Tbより、0.06秒以上となる。 When the reproduced audio signal is a human sound (speech sound), the repetition frequency (1 / Tc) of the overlap portion is out of the generally effective voice band (for example, 85 Hz to 8 kHz). Considering that it is desirable to reduce the influence of overtones, 1 / Tc is set to 20 Hz or less, that is, the third time Tc is set to 0.05 seconds or more. In this case, the fundamental frequency component due to repetition of the overlap portion is 20 Hz or less, and is lower than the lower limit of the voice band, for example, 85 Hz, up to about the second to third harmonics of overtones. Can be suppressed. On the other hand, if the second time Tb, which is the length of the overlap portion, is too short, the attenuation curve for crossfading becomes steep, and the influence of distorting the audio signal waveform at the block end cannot be ignored. Considering that, if it is 0.01 seconds or longer and is too long, the reversal of time caused by the sound generated at the end of the previous block being delayed from the sound generated at the end of the next block cannot be ignored for hearing. In consideration of the above, it was set to 0.05 seconds or less. In this way, by setting the second time Tb, which is the length of the overlap portion, to 0.01 seconds to 0.05 seconds, the waveform distortion at the block end is small, and the time at the overlap portion is reduced. The reversal phenomenon is also suppressed to the extent that there is no problem with hearing. In the case of this audio signal, the first time Ta, which is the block division period, is 0.06 seconds or more from Ta = Tc + Tb.
これに対して、音楽番組等を早見再生するような、再生されるオーディオ信号が主として音楽(music)の場合には、上記音声信号の場合の各時間Ta〜Tc等の設定では、音楽のテンポ感が損なわれる。すなわち、音楽の場合には、音符の長さが正確に再現されることが重要であり、上記音声信号のように分割周期Taが0.06秒以上もあると、上記分割ブロックの長さが最短の音符の時間に近付いたり最短の音符よりも長くなったりするため、オーバーラップ加算すると音符の長さが不正確となり、テンポ感あるいはリズム感が乱されることになる。この点を考慮して、音楽信号の場合のブロック分割周期(第1の時間)Taを、0.05秒以下としている。また、オーバーラップ部分の長さ(第2の時間)Tbについては、再生速度が何倍速かによるが、例えば1.3倍速再生の場合には、第2の時間Tbは0.12秒以下となる。このように、第1の時間Taや第2の時間Tbを短くする場合に、オーバーラップ部分の繰り返し周波数による低域や中域の周波数帯域への影響や、オーバーラップ部分での波形歪による高域周波数を含む音質への影響が無視できなくなるが、音楽信号を上述したようなOLA(オーバーラップ加算)によって処理する場合には何らかの音質への影響は避けられないことから、音楽番組等を早見再生するような場合には曲のテンポ感あるいはリズム感が保たれることが最も重要である点を考慮し、上述のように、第1の時間Taを0.05秒以下としたものである。 On the other hand, when the audio signal to be reproduced is mainly music (music), for example, when a music program is played at a high speed, the tempo of the music is set for each time Ta to Tc in the case of the audio signal. The feeling is impaired. That is, in the case of music, it is important that the lengths of the notes are accurately reproduced. If the division period Ta is 0.06 seconds or more as in the case of the audio signal, the length of the division block is reduced. Since it approaches the time of the shortest note or becomes longer than the shortest note, if the overlap is added, the length of the note becomes inaccurate, and the sense of tempo or rhythm is disturbed. Considering this point, the block division period (first time) Ta in the case of a music signal is set to 0.05 seconds or less. The overlap portion length (second time) Tb depends on how many times the playback speed is. For example, in the case of 1.3 times speed playback, the second time Tb is 0.12 seconds or less. Become. As described above, when the first time Ta and the second time Tb are shortened, the influence of the repetition frequency of the overlap portion on the low frequency band and the middle frequency band, and the waveform distortion at the overlap portion are high. Although the influence on the sound quality including the frequency band cannot be ignored, if the music signal is processed by the OLA (overlap addition) as described above, the influence on the sound quality is unavoidable. In consideration of the point that it is most important that the tempo or rhythm of the song is maintained in the case of reproduction, the first time Ta is set to 0.05 seconds or less as described above. .
また、音楽バラエティ番組やミュージカル等のように音声と音楽とが混在しいずれも重要な場合や、音声か音楽かの判別がつきにくいような場合には、上記各時間Ta〜Tcとしては、上記音声の場合と音楽の場合の中間的な値に設定することが好ましい。この点を考慮し、再生されたオーディオ信号が音声信号及び音楽信号を含むとき、あるいは音声信号か音楽信号かを区別できないとき、オーバーラップ部分の繰り返し周期である第3の時間Tcを0.025秒以上とし、オーバーラップ部分の長さである第2の時間Tbを0.005秒〜0.025秒とするようにしている。 In addition, when the voice and music are both mixed and important, such as music variety programs and musicals, or when it is difficult to distinguish between voice and music, each of the times Ta to Tc is as described above. It is preferable to set an intermediate value between audio and music. Considering this point, when the reproduced audio signal includes an audio signal and a music signal, or when it is not possible to distinguish between the audio signal and the music signal, the third time Tc that is the repetition period of the overlap portion is set to 0.025. The second time Tb, which is the length of the overlap portion, is set to 0.005 seconds to 0.025 seconds.
このように、早見再生等により高速再生される番組の種類あるいはジャンルにより、オーディオ信号をOLA(オーバーラップ加算)処理するときの各時間Ta〜Tcの適切な値が異なることを考慮し、番組の種類あるいはジャンルにより各時間Ta〜Tcを切換制御することが好ましい。具体的には、人間が再生される番組等の種類やジャンルを判断して、図2のキー群42を手動操作することにより、システムコントローラ41に各時間Ta〜Tcの値を切り換え制御させることが挙げられる。また、テレビジョン放送番組のいわゆるEPG(電子プログラムガイド)を得ることができる場合には、図2のEPG検出回路45により、EPG情報中の番組の種類やジャンルを示す属性情報を抽出し、これをシステムコントローラ41に送ることにより、各時間Ta〜Tcの値を切換制御するようにしてもよい。
In this way, considering that the appropriate value of each time Ta to Tc when the audio signal is subjected to OLA (overlap addition) processing differs depending on the type or genre of the program that is reproduced at high speed by fast-viewing reproduction, etc. It is preferable to switch and control each time Ta to Tc depending on the type or genre. Specifically, the type and genre of a program to be played back by a human being is judged, and the
次に、本発明の実施の形態を、ビデオ信号のいわゆるハードディスクレコーダ等に適用する場合に、撮り溜めたテレビジョン放送番組等を早見再生する用途が考えられ、この場合の再生速度は2倍程度までであるが、さらに番組内容をある程度楽しめるような再生速度としては、1.3〜1.5倍速程度が考えられる。以下に具体例として、再生速度を記録時の速度(標準再生速度)の1.3倍とした場合のベストチューニングの各時間Ta〜Tcの例を挙げる。 Next, when the embodiment of the present invention is applied to a so-called hard disk recorder or the like of a video signal, it can be used to quickly reproduce a television broadcast program that has been collected, and the reproduction speed in this case is about double. However, as a playback speed that can further enjoy the contents of the program to some extent, about 1.3 to 1.5 times speed can be considered. As a specific example, examples of best tuning times Ta to Tc when the playback speed is 1.3 times the recording speed (standard playback speed) will be given below.
標準の1.3倍速で再生されたオーディオ信号が音声信号の場合、オーバーラップ部分の繰り返し周期である第3の時間Tcを0.111秒とし、オーバーラップ部分の長さである第2の時間Tbを0.033秒とする。このとき、オーバーラップ部分の繰り返しによる基本周波数成分は約9Hzとなり、人間の音声の帯域である85Hz〜8kHzの最低域よりも十分に低いため、数次程度の高調波も含めて、音声への悪影響が少なく、低域をあまり強調する必要がないBGM(バックグラウンドミュージック)に対しても影響が少ない。また、オーバーラップ部分の長さ(第2の時間)Tbは0.033秒であるため、オーバーラップ部分をクロスフェードするときの減衰曲線が急になることによる波形歪を抑えながら、オーバーラップ部分で前後のブロックの時間関係が逆転する影響を少なくできる。 When the audio signal reproduced at the standard 1.3 times speed is an audio signal, the third time Tc that is the repetition period of the overlap portion is set to 0.111 seconds, and the second time that is the length of the overlap portion. Tb is set to 0.033 seconds. At this time, the fundamental frequency component due to the repetition of the overlap portion is about 9 Hz, which is sufficiently lower than the lowest frequency range of 85 Hz to 8 kHz, which is the human voice band, and therefore includes harmonics of several orders. There is little adverse effect, and there is little influence on BGM (background music) that does not need to emphasize the low range too much. In addition, since the length (second time) Tb of the overlap portion is 0.033 seconds, the overlap portion is suppressed while suppressing waveform distortion due to a steep attenuation curve when the overlap portion is crossfade. Can reduce the influence of the time relationship between the previous and next blocks being reversed.
標準の1.3倍速で再生されたオーディオ信号が音楽信号の場合には、ブロック分割周期である第1の時間Taを0.024秒とし、オーバーラップ部分の長さである第2の時間Tbを0.0053秒とする。ここで、テンポの非常に速い曲として、一分間に四分音符で250(M.M.=250)程度の曲を想定する場合、四分音符の長さが0.24秒であり、一六分音符でも0.06秒であるから、ブロック分割周期が0.024秒であれば、四分音符は10個程度のブロックに分割され、16分音符でも2〜3個程度のブロックに分割され、OLA(オーバーラップ加算)によるテンポ感あるいはリズム感の乱れは殆ど感じられないものとなる。 When the audio signal reproduced at the standard 1.3 times speed is a music signal, the first time Ta that is the block division period is set to 0.024 seconds, and the second time Tb that is the length of the overlap portion. Is 0.0053 seconds. Here, when assuming a tune of about 250 (MM = 250) with one quarter note as a song with a very fast tempo, the length of the quarter note is 0.24 seconds, Since the sixth note is 0.06 seconds, if the block division period is 0.024 seconds, the quarter note is divided into about 10 blocks, and even the 16th note is divided into about 2 to 3 blocks. Thus, the tempo or rhythmic disturbance due to OLA (overlap addition) is hardly felt.
従って、図2のシステムコントローラ41は、人間がジャンルを判断してキー群42を操作することに応じて、あるいはEPG検出回路45からのジャンル情報に応じて、上記オーディオ信号をOLA(オーバーラップ加算)処理するときの各時間Ta〜Tcを切換制御しており、高速再生される番組がニュースやドラマ等の音声信号が重要とされるジャンルの場合には、オーバーラップ部分の繰り返し周期である第3の時間Tcを0.111秒に、オーバーラップ部分の長さである第2の時間Tbを0.033秒に切換制御し、また、高速再生される番組が音楽番組等の音楽信号が重要なジャンルの場合には、分割周期である第1の時間Taを0.024秒に、オーバーラップ部分の長さである第2の時間Tbを0.0053秒に切換制御する。
Therefore, the system controller 41 in FIG. 2 outputs the audio signal in accordance with OLA (overlap addition) in response to a human operating the
これによって、高速再生される番組のオーディオ信号に最適なOLA(オーバーラップ加算)処理が行われ、簡単な構成にも拘わらず音程を変えずに良好なオーディオ信号を聴取できる。 As a result, an optimal OLA (overlap addition) process is performed on the audio signal of the program to be played back at high speed, and a good audio signal can be heard without changing the pitch despite the simple configuration.
次に、図3は本発明の実施の形態となる変速再生方法の動作を説明するためのフローチャートである。この図3において、ステップS1で変速再生、例えば上述した早見再生により、オーディオ信号を標準再生速度(記録速度)よりも高速(例えば1.3倍速)で再生する。 Next, FIG. 3 is a flowchart for explaining the operation of the variable speed reproduction method according to the embodiment of the present invention. In FIG. 3, the audio signal is reproduced at a higher speed (eg, 1.3 times faster) than the standard reproduction speed (recording speed) by variable speed reproduction at step S1, for example, the above-mentioned quick-reproduction.
次のステップS2では、高速再生された信号の種類やジャンルに応じて、例えばオーディオ信号が音声を主体とするものか音楽を主体とするものかに応じて、上記各時間Ta,Tb,Tcを決定する。具体的に、例えば1.3倍の早見再生の場合においては、図2のシステムコントローラ41により、音声信号の場合はオーバーラップ部分の繰り返し周期(第3の時間Tc)を0.111秒に、オーバーラップ部分の長(第2の時間Tb)を0.033秒に切換制御し、また、音楽信号の場合には、分割周期(第1の時間Ta)を0.024秒に、オーバーラップ部分の長さ(第2の時間Tb)を0.0053秒に切換制御する。一般的には、再生オーディオ信号が音声信号の場合に、オーバーラップ部分の繰り返し周期である第3の時間Tcを0.05秒以上とし、オーバーラップ部分の長さである第2の時間Tbを0.01秒〜0.05秒とし、再生オーディオ信号が音楽信号の場合に、上記分割周期である第1の時間Taを0.05秒以下とする。また、再生されたオーディオ信号が音声信号及び音楽信号を含むとき、あるいは音声信号か音楽信号かを区別できないとき、オーバーラップ部分の繰り返し周期である第3の時間Tcを0.025秒以上とし、オーバーラップ部分の長さである第2の時間Tbを0.005秒〜0.025秒とする。 In the next step S2, the respective times Ta, Tb, Tc are determined according to the type and genre of the signal reproduced at high speed, for example, depending on whether the audio signal is mainly voice or music. decide. Specifically, for example, in the case of 1.3 times quick playback, the system controller 41 in FIG. 2 sets the repetition period (third time Tc) of the overlap portion to 0.111 seconds in the case of an audio signal. The overlap portion length (second time Tb) is controlled to be switched to 0.033 seconds. In the case of a music signal, the division period (first time Ta) is set to 0.024 seconds, and the overlap portion is Is switched to 0.0053 seconds (second time Tb). In general, when the reproduced audio signal is an audio signal, the third time Tc, which is the repetition period of the overlap portion, is set to 0.05 seconds or more, and the second time Tb, which is the length of the overlap portion, is set. When the playback audio signal is a music signal, the first time Ta, which is the division period, is set to 0.05 seconds or less. When the reproduced audio signal includes a voice signal and a music signal, or when it is not possible to distinguish between the voice signal and the music signal, the third time Tc that is the repetition period of the overlap portion is set to 0.025 seconds or more, The second time Tb that is the length of the overlap portion is set to 0.005 seconds to 0.025 seconds.
次のステップS3では、ブロック分割周期である記録時間軸上の第1の時間Ta毎にオーディオ信号をブロック分割し、次のステップS4で、各ブロックの端部を記録時間軸上のそれぞれ第2の時間Tbだけオーバーラップさせると共にクロスフェード処理して連結する。 In the next step S3, the audio signal is divided into blocks for each first time Ta on the recording time axis which is a block division cycle, and in the next step S4, the end of each block is set to the second time on the recording time axis. Are overlapped only for a time Tb and connected by crossfading.
上述したような本発明の実施の形態によれば、変速再生されるオーディオ信号が音声信号の場合には、オーバーラップ部分の繰り返しによる基本周波数成分は十分に低くなり、人間の音声の帯域である85Hz〜8kHzから外れているため、音声への悪影響が少なく、低域をあまり強調する必要がないBGM(バックグラウンドミュージック)に対しても影響が少ないと共に、オーバーラップ部分をクロスフェードするときの減衰曲線が急になることによる波形歪を抑えながら、オーバーラップ部分で前後のブロックの時間関係が逆転する影響を少なくできる。また、変速再生されるオーディオ信号が音楽信号の場合には、音楽のテンポ感が良好に保たれる。さらに、変速再生されるオーディオ信号が音声信号及び音楽信号を含むとき、あるいは音声信号か音楽信号かを区別できないときには、音声への影響もある程度抑えながら、音楽のテンポ感も適度に保たれるような再生が行える。このように、変速再生されるオーディオ信号が音声信号か音楽信号か等の種類あるいはジャンルを示す属性に応じて、それぞれ適切な各時間Ta〜Tcが設定されるため、それぞれのオーディオ信号の性質を良好に保った変速再生が実現可能となる。 According to the embodiment of the present invention as described above, when the audio signal to be played back at a variable speed is an audio signal, the fundamental frequency component due to the repetition of the overlap portion is sufficiently low, which is a human audio band. Since it is outside the range of 85Hz to 8kHz, there is little adverse effect on the sound, there is little effect on BGM (background music) that does not need to emphasize the low range too much, and attenuation when cross-fading the overlap part While suppressing the waveform distortion due to the steep curve, the influence of reversing the time relationship between the preceding and succeeding blocks in the overlap portion can be reduced. Further, when the audio signal to be played back at a variable speed is a music signal, the tempo of the music is kept good. Furthermore, when the audio signal to be played back at a variable speed includes a sound signal and a music signal, or when it cannot be distinguished whether it is a sound signal or a music signal, the tempo of the music is kept moderate while suppressing the influence on the sound to some extent. Playback is possible. As described above, since the appropriate times Ta to Tc are set according to the attribute indicating the type or genre such as whether the audio signal to be reproduced with a variable speed is an audio signal or a music signal, the properties of the respective audio signals are set. It is possible to realize variable speed reproduction while maintaining good conditions.
なお、本発明は上述した実施の形態のみに限定されるものではなく、本発明の要旨を逸脱しない範囲において種々の変更が可能であることは勿論である。 It should be noted that the present invention is not limited to the above-described embodiments, and various modifications can be made without departing from the scope of the present invention.
11 ハードディスク装置、 12 インターフェース(I/F)回路、 14 MPEGエンコード/デコード回路、 21 オーディオ処理回路、 22 IO(入出力)プロセッサ、 23 バッファメモリ、 31 誤り訂正エンコード/デコード回路、 32 音声圧縮エンコード/デコード回路、 33 メモリコントローラ、 34 バッファメモリ、 41 システムコントローラ、 42 キー群、 43 ディスプレイ、 45 EPG検出回路
11 hard disk drive, 12 interface (I / F) circuit, 14 MPEG encoding / decoding circuit, 21 audio processing circuit, 22 IO (input / output) processor, 23 buffer memory, 31 error correction encoding / decoding circuit, 32 audio compression encoding / decoding Decode circuit, 33 memory controller, 34 buffer memory, 41 system controller, 42 key group, 43 display, 45 EPG detection circuit
Claims (10)
上記再生されたオーディオ信号を記録時間軸上で分割周期としての第1の時間Taのブロックに分割する分割工程と、
上記分割された一のブロックの終端部分と次のブロックの先端部分とを記録時間軸上の第2の時間Tbでオーバーラップさせ、各オーバーラップ部分でクロスフェード処理を行うことにより連結する連結工程とを有し、
上記オーディオ信号が音声信号の場合に、上記オーバーラップ部分の繰り返し周期である第3の時間Tc(Tc=Ta−Tb)を0.05秒以上とし、上記オーバーラップ部分の第2の時間Tbを0.01秒〜0.05秒とし、
上記オーディオ信号が音楽信号の場合に、上記分割周期である第1の時間Taを0.05秒以下とすること
を特徴とするオーディオ信号の変速再生方法。 A reproduction step of reproducing the audio signal recorded on the recording medium at a reproduction speed different from that at the time of recording;
A division step of dividing the reproduced audio signal into blocks of a first time Ta as a division period on the recording time axis;
A connecting step in which the end portion of the divided one block and the leading end portion of the next block are overlapped at a second time Tb on the recording time axis, and crossover processing is performed at each overlap portion. And
When the audio signal is an audio signal, the third time Tc (Tc = Ta−Tb), which is the repetition period of the overlap portion, is set to 0.05 seconds or more, and the second time Tb of the overlap portion is set. 0.01 seconds to 0.05 seconds,
When the audio signal is a music signal, the first time Ta, which is the division period, is set to 0.05 seconds or less.
上記オーバーラップ部分の繰り返し周期である第3の時間Tc(Tc=Ta−Tb)を0.025秒以上とし、上記オーバーラップ部分の第2の時間Tbを0.005秒〜0.025秒とすること
を特徴とする請求項1記載の変速再生方法。 When the reproduced audio signal includes an audio signal and a music signal, or when it is not possible to distinguish between an audio signal and a music signal,
A third time Tc (Tc = Ta−Tb) that is a repetition period of the overlap portion is set to 0.025 seconds or more, and a second time Tb of the overlap portion is set to 0.005 seconds to 0.025 seconds. The variable speed reproduction method according to claim 1, wherein:
この判別工程により判別されたオーディオ信号の種類に応じて上記各時間Ta〜Tcを切り換えること
を特徴とする請求項1記載の変速再生方法。 A determination step of determining whether the reproduced audio signal is an audio signal or a music signal;
2. The variable speed reproduction method according to claim 1, wherein the times Ta to Tc are switched in accordance with the type of the audio signal discriminated in the discriminating step.
上記オーディオ信号が音声信号の場合に、上記オーバーラップ部分の繰り返し周期である第3の時間Tcを0.111秒とし、上記オーバーラップ部分の第2の時間Tbを0.033秒とし、
上記オーディオ信号が音楽信号の場合に、上記分割周期である第1の時間Taを0.024秒とし、上記オーバーラップ部分の第2の時間Tbを0.0053秒とすること
を特徴とする請求項1記載の変速再生方法。 When the playback speed is 1.3 times the recording speed,
When the audio signal is an audio signal, the third time Tc that is the repetition period of the overlap portion is set to 0.111 seconds, the second time Tb of the overlap portion is set to 0.033 seconds,
When the audio signal is a music signal, the first time Ta, which is the division period, is set to 0.024 seconds, and the second time Tb of the overlap portion is set to 0.0053 seconds. Item 4. The variable speed reproduction method according to Item 1.
上記再生されたオーディオ信号を記録時間軸上で分割周期としての第1の時間Taのブロックに分割し、上記分割された一のブロックの終端部分と次のブロックの先端部分とを記録時間軸上の第2の時間Tbでオーバーラップさせ、各オーバーラップ部分でクロスフェード処理を行うことにより連結する制御手段とを有し、
上記制御手段は、上記オーディオ信号が音声信号の場合に、上記オーバーラップ部分の繰り返し周期である第3の時間Tc(Tc=Ta−Tb)を0.05秒以上とし、上記オーバーラップ部分の第2の時間Tbを0.01秒〜0.05秒とし、上記オーディオ信号が音楽信号の場合に、上記分割周期である第1の時間Taを0.05秒以下とすること
を特徴とするオーディオ信号の変速再生装置。 Reproduction means for reproducing the audio signal recorded on the recording medium at a reproduction speed different from that at the time of recording;
The reproduced audio signal is divided into blocks of the first time Ta as a division period on the recording time axis, and the end portion of the divided one block and the leading end portion of the next block are recorded on the recording time axis. And a control means for connecting by overlapping each other at a second time Tb and performing a cross-fade process at each overlapping portion,
When the audio signal is an audio signal, the control means sets a third time Tc (Tc = Ta−Tb), which is a repetition period of the overlap portion, to be 0.05 seconds or more, and sets the third time of the overlap portion. The time Tb of 2 is 0.01 seconds to 0.05 seconds, and when the audio signal is a music signal, the first time Ta that is the division period is 0.05 seconds or less. A variable speed signal reproduction device.
を特徴とする請求項5記載の変速再生装置。 When the reproduced audio signal includes a sound signal and a music signal, or when the control means cannot distinguish between the sound signal and the music signal, the control means performs a third time Tc (Tc = Tc = Tc = the repetition period of the overlap portion). 6. The variable speed playback apparatus according to claim 5, wherein Ta-Tb) is set to 0.025 seconds or longer, and the second time Tb of the overlap portion is set to 0.005 seconds to 0.025 seconds.
を特徴とする請求項5記載の変速再生装置。 The said control means discriminate | determines whether the said reproduced audio signal is an audio | voice signal or a music signal, and switches said each time Ta-Tc according to the discriminated type of the audio signal. Variable speed playback device.
を特徴とする請求項5記載の変速再生装置。 When the reproduction speed is 1.3 times the recording speed and the audio signal is an audio signal, the control means sets a third time Tc that is a repetition period of the overlap portion to 0.111. Second, the second time Tb of the overlap portion is 0.033 seconds, and when the audio signal is a music signal, the first time Ta as the division period is 0.024 seconds, and the overlap 6. The variable speed playback apparatus according to claim 5, wherein the second time Tb of the portion is set to 0.0053 seconds.
上記再生されたオーディオ信号の種類を示す属性情報を検出する属性検出工程と、
上記再生されたオーディオ信号を記録時間軸上で分割周期としての第1の時間Taのブロックに分割する分割工程と、
上記分割された一のブロックの終端部分と次のブロックの先端部分とを記録時間軸上の第2の時間Tbでオーバーラップさせ、各オーバーラップ部分でクロスフェード処理を行うことにより連結する連結工程とを有し、
上記検出された属性情報に応じて、上記分割周期である第1の時間Ta及び上記オーバーラップ部分の第2の時間Tbを切換制御すること
を特徴とする変速再生方法。 A reproduction step of controlling reproduction of the audio signal recorded on the recording medium at a reproduction speed different from that at the time of recording;
An attribute detection step of detecting attribute information indicating the type of the reproduced audio signal;
A division step of dividing the reproduced audio signal into blocks of a first time Ta as a division period on the recording time axis;
A connecting step in which the end portion of the divided one block and the leading end portion of the next block are overlapped at a second time Tb on the recording time axis, and crossover processing is performed at each overlap portion. And
According to the detected attribute information, the variable speed reproduction method characterized by switching and controlling the first time Ta which is the division period and the second time Tb of the overlap portion.
記録媒体に記録されたオーディオ信号を記録時とは異なる再生速度で再生制御する手順と、
上記再生されたオーディオ信号を記録時間軸上で分割周期としての第1の時間Taのブロックに分割する手順と、
上記分割された一のブロックの終端部分と次のブロックの先端部分とを記録時間軸上の第2の時間Tbでオーバーラップさせ、各オーバーラップ部分でクロスフェード処理を行うことにより連結する手順と
を実行させるためのプログラムであって、
上記オーディオ信号が音声信号の場合に、上記オーバーラップ部分の繰り返し周期である第3の時間Tc(Tc=Ta−Tb)を0.05秒以上とし、上記オーバーラップ部分の第2の時間Tbを0.01秒〜0.05秒とし、
上記オーディオ信号が音楽信号の場合に、上記分割周期である第1の時間Taを0.05秒以下とすること
を特徴とするプログラム。
On the computer,
A procedure for controlling playback of an audio signal recorded on a recording medium at a playback speed different from that at the time of recording;
Dividing the reproduced audio signal into blocks of a first time Ta as a division period on the recording time axis;
A procedure for connecting the end portion of the divided one block and the leading end portion of the next block at a second time Tb on the recording time axis and performing cross-fade processing at each overlap portion; A program for executing
When the audio signal is an audio signal, the third time Tc (Tc = Ta−Tb), which is the repetition period of the overlap portion, is set to 0.05 seconds or more, and the second time Tb of the overlap portion is set. 0.01 seconds to 0.05 seconds,
When the audio signal is a music signal, the first time Ta as the division period is set to 0.05 seconds or less.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004081498A JP4542805B2 (en) | 2004-03-19 | 2004-03-19 | Variable speed reproduction method and apparatus, and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004081498A JP4542805B2 (en) | 2004-03-19 | 2004-03-19 | Variable speed reproduction method and apparatus, and program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005266571A true JP2005266571A (en) | 2005-09-29 |
JP4542805B2 JP4542805B2 (en) | 2010-09-15 |
Family
ID=35091157
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004081498A Expired - Fee Related JP4542805B2 (en) | 2004-03-19 | 2004-03-19 | Variable speed reproduction method and apparatus, and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4542805B2 (en) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007304515A (en) * | 2006-05-15 | 2007-11-22 | Sony Corp | Audio signal decompressing and compressing method and device |
JP2008058956A (en) * | 2006-07-31 | 2008-03-13 | Matsushita Electric Ind Co Ltd | Speech reproduction device |
JP2011007959A (en) * | 2009-06-24 | 2011-01-13 | Ge Medical Systems Global Technology Co Llc | Speech data processing device, magnetic resonance imaging device, speech data processing method and program |
US7894654B2 (en) | 2008-07-08 | 2011-02-22 | Ge Medical Systems Global Technology Company, Llc | Voice data processing for converting voice data into voice playback data |
US8484018B2 (en) | 2009-08-21 | 2013-07-09 | Casio Computer Co., Ltd | Data converting apparatus and method that divides input data into plural frames and partially overlaps the divided frames to produce output data |
CN113643728A (en) * | 2021-08-12 | 2021-11-12 | 荣耀终端有限公司 | Audio recording method, electronic device, medium, and program product |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06202692A (en) * | 1993-01-06 | 1994-07-22 | Nippon Telegr & Teleph Corp <Ntt> | Control system for speech reproducing speed |
JPH08287612A (en) * | 1995-04-14 | 1996-11-01 | Sony Corp | Variable speed reproducing method for audio data |
JPH09146587A (en) * | 1995-11-28 | 1997-06-06 | Sanyo Electric Co Ltd | Speech speed changer |
JPH09330094A (en) * | 1996-06-10 | 1997-12-22 | Takako Ito | Voice reproducing device with variable tempo function |
JPH10282991A (en) * | 1997-04-02 | 1998-10-23 | Matsushita Graphic Commun Syst Inc | Speech rate converting device |
JP2001255876A (en) * | 2000-03-13 | 2001-09-21 | Yamaha Corp | Method for expanding and compressing musical sound waveform signal in time base direction |
JP2001282297A (en) * | 2000-03-29 | 2001-10-12 | Pioneer Electronic Corp | Method and device for reproducing sound information |
JP2005535915A (en) * | 2002-08-08 | 2005-11-24 | コスモタン インク | Time scale correction method of audio signal using variable length synthesis and correlation calculation reduction technique |
-
2004
- 2004-03-19 JP JP2004081498A patent/JP4542805B2/en not_active Expired - Fee Related
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06202692A (en) * | 1993-01-06 | 1994-07-22 | Nippon Telegr & Teleph Corp <Ntt> | Control system for speech reproducing speed |
JPH08287612A (en) * | 1995-04-14 | 1996-11-01 | Sony Corp | Variable speed reproducing method for audio data |
JPH09146587A (en) * | 1995-11-28 | 1997-06-06 | Sanyo Electric Co Ltd | Speech speed changer |
JPH09330094A (en) * | 1996-06-10 | 1997-12-22 | Takako Ito | Voice reproducing device with variable tempo function |
JPH10282991A (en) * | 1997-04-02 | 1998-10-23 | Matsushita Graphic Commun Syst Inc | Speech rate converting device |
JP2001255876A (en) * | 2000-03-13 | 2001-09-21 | Yamaha Corp | Method for expanding and compressing musical sound waveform signal in time base direction |
JP2001282297A (en) * | 2000-03-29 | 2001-10-12 | Pioneer Electronic Corp | Method and device for reproducing sound information |
JP2005535915A (en) * | 2002-08-08 | 2005-11-24 | コスモタン インク | Time scale correction method of audio signal using variable length synthesis and correlation calculation reduction technique |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007304515A (en) * | 2006-05-15 | 2007-11-22 | Sony Corp | Audio signal decompressing and compressing method and device |
US8306828B2 (en) | 2006-05-15 | 2012-11-06 | Sony Corporation | Method and apparatus for audio signal expansion and compression |
JP2008058956A (en) * | 2006-07-31 | 2008-03-13 | Matsushita Electric Ind Co Ltd | Speech reproduction device |
US7894654B2 (en) | 2008-07-08 | 2011-02-22 | Ge Medical Systems Global Technology Company, Llc | Voice data processing for converting voice data into voice playback data |
JP2011007959A (en) * | 2009-06-24 | 2011-01-13 | Ge Medical Systems Global Technology Co Llc | Speech data processing device, magnetic resonance imaging device, speech data processing method and program |
US8484018B2 (en) | 2009-08-21 | 2013-07-09 | Casio Computer Co., Ltd | Data converting apparatus and method that divides input data into plural frames and partially overlaps the divided frames to produce output data |
CN113643728A (en) * | 2021-08-12 | 2021-11-12 | 荣耀终端有限公司 | Audio recording method, electronic device, medium, and program product |
CN113643728B (en) * | 2021-08-12 | 2023-08-22 | 荣耀终端有限公司 | Audio recording method, electronic equipment, medium and program product |
Also Published As
Publication number | Publication date |
---|---|
JP4542805B2 (en) | 2010-09-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9336823B2 (en) | Playing audio in trick-modes | |
JP3925306B2 (en) | Digital audio signal reproduction device | |
JP4236589B2 (en) | Audio track playback method and apparatus for video trick mode playback | |
JP2005519538A (en) | Silence period elimination by gate in video trick mode | |
JP4542805B2 (en) | Variable speed reproduction method and apparatus, and program | |
JP4990375B2 (en) | Recording / playback device | |
JP2005044409A (en) | Information reproducing device, information reproducing method, and information reproducing program | |
JPH08287612A (en) | Variable speed reproducing method for audio data | |
JP4739598B2 (en) | Music data playback device | |
US7889969B2 (en) | Audio frequency shifting during video trick modes | |
JP4107212B2 (en) | Music playback device | |
JP2007179604A (en) | Music player, reproduction control method, and program | |
JP2007257771A (en) | Reproducing device, reproducing method, program, and recording medium | |
JP2000195234A (en) | Reproducing device and method | |
JP5751421B2 (en) | Audio playback device, audio playback method, and program | |
JP2007101772A (en) | Reproducing device and reproducing method | |
JP2008145841A (en) | Reproduction device, reproduction method, signal processing device and signal processing method | |
JP3559326B2 (en) | Optical disc playback device | |
JP3812270B2 (en) | Recording medium playback device | |
JP2004303409A (en) | Digital voice signal reproduction system | |
JPH08287610A (en) | Audio data reproducing device | |
JP4193240B2 (en) | Compressed encoded data decoding apparatus and karaoke apparatus using the same | |
JP2005257832A (en) | Musical performance reproducing device | |
WO2013035170A1 (en) | Recording device, recording method and computer program for controlling recording | |
JP2006085843A (en) | Recording apparatus and method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070222 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100126 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100317 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100601 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100628 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130702 Year of fee payment: 3 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313115 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130702 Year of fee payment: 3 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |