JP2005266571A - Method and device for variable-speed reproduction, and program - Google Patents

Method and device for variable-speed reproduction, and program Download PDF

Info

Publication number
JP2005266571A
JP2005266571A JP2004081498A JP2004081498A JP2005266571A JP 2005266571 A JP2005266571 A JP 2005266571A JP 2004081498 A JP2004081498 A JP 2004081498A JP 2004081498 A JP2004081498 A JP 2004081498A JP 2005266571 A JP2005266571 A JP 2005266571A
Authority
JP
Japan
Prior art keywords
time
audio signal
seconds
signal
recording
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2004081498A
Other languages
Japanese (ja)
Other versions
JP4542805B2 (en
Inventor
Naoki Tokiwa
直樹 常盤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Interactive Entertainment Inc
Sony Corp
Original Assignee
Sony Corp
Sony Computer Entertainment Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp, Sony Computer Entertainment Inc filed Critical Sony Corp
Priority to JP2004081498A priority Critical patent/JP4542805B2/en
Publication of JP2005266571A publication Critical patent/JP2005266571A/en
Application granted granted Critical
Publication of JP4542805B2 publication Critical patent/JP4542805B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Abstract

<P>PROBLEM TO BE SOLVED: To minimize adverse influence on an audio signal without changing the interval while simplifying constitution when the audio signal is reproduced at a variable speed. <P>SOLUTION: At a step S1, the audio signal is reproduced at a variable speed different from that in recording and at a step S2, a division period Ta of OLA (overlap addition) processing, a length Tb of an overlap part, and a repetition period Tc of the overlap part are determined according to whether the reproduced audio signal is a speech or music. At a step S3, the reproduced audio signal is divided into blocks of a time Ta and at a step S4, the tail part of one block and the head part of a next block are connected through cross-fading processing while overlapping each other for a time Tb. When the reproduced audio signal is a speech, the time Tc is ≥0.05 second and the time Tb is 0.01 to 0.05 second, but when music, the time Ta is <0.05 second. <P>COPYRIGHT: (C)2005,JPO&NCIPI

Description

本発明は、音声や楽音等のオーディオ信号の音程を変えずに標準速度(記録速度)とは異なる再生速度で再生を行うような変速再生方法及び装置、並びにプログラムに関する。   The present invention relates to a variable speed reproduction method and apparatus, and a program that perform reproduction at a reproduction speed different from a standard speed (recording speed) without changing the pitch of an audio signal such as voice or musical sound.

光ディスクや磁気ディスク、磁気テープ等の記録媒体から再生するときの再生速度を、記録時の(標準の)速度とは異ならせる場合に、オーディオ信号の音程を変えることなく再生速度を変換する技術が知られている。これは、例えば、テレビジョン放送番組等をハードディスク等の記録媒体に録画し、ニュース等を早見再生したい場合に、音程が変わると聞きにくいことから、早見再生しても音程が変化しないようにすることが望まれ、このような用途に、変速再生しても音程を変えない技術が用いられるものである。   Technology that converts the playback speed without changing the pitch of the audio signal when the playback speed when playing back from a recording medium such as an optical disk, magnetic disk, or magnetic tape is different from the (standard) speed during recording. Are known. This is because, for example, when a television broadcast program or the like is recorded on a recording medium such as a hard disk and news or the like is to be played back quickly, it is difficult to hear when the pitch changes, so that the pitch does not change even when played back quickly. For this purpose, a technique that does not change the pitch even when the variable speed reproduction is used is used.

この音程を変えずに再生速度を可変する技術の一例としては、変速再生されて得られた時間領域のディジタルオーディオデータを一旦周波数領域のデータに変換し、周波数軸上で記録時の音程に戻すような処理等を行った後、再び時間領域のデータに逆変換する技術がある。このような周波数領域での処理を伴う技術においては、時間領域と周波数領域との間の変換及び逆変換のためのDCT(離散コサイン変換)、MDCT(改良DCT)、DFT(離散フーリエ変換)等の演算処理が必要とされ、処理が複雑化し、演算量も増えるため、より簡易的な技術として、非特許文献1や特許文献1に示すように、時間領域でデータ処理を行うものが知られている。これは、記録媒体から記録時異なる再生速度で再生して得られたオーディオ信号を、一定の時間毎のブロックに分割し、一のブロックの終端部分と次のブロックの先端部分とをオーバーラップさせ、各オーバーラップ部分でクロスフェード処理を行いながら連結すること(オーバーラップ加算:OLA)により、滑らかに繋ぎ合わせている。   As an example of a technique for changing the playback speed without changing the pitch, time-domain digital audio data obtained by variable speed playback is once converted into frequency-domain data and returned to the pitch at the time of recording on the frequency axis. There is a technique for performing inverse conversion to time domain data again after performing such processing. In such a technique involving processing in the frequency domain, DCT (discrete cosine transform), MDCT (improved DCT), DFT (discrete Fourier transform), etc. for transforming between time domain and frequency domain and inverse transform As a simpler technique, as shown in Non-Patent Document 1 and Patent Document 1, data processing in the time domain is known, because the above-described calculation processing is required, the processing becomes complicated, and the amount of calculation increases. ing. This is because the audio signal obtained by playing back from the recording medium at different playback speeds is divided into blocks at regular intervals, and the end of one block overlaps the end of the next block. The connection is performed smoothly by performing the cross fading process at each overlap portion (overlap addition: OLA).

すなわち、図4の(A)のような元の(記録時の)オーディオ信号に対して、記録時間軸上の第1の時間Ta毎にブロック分割し、図4の(B)に示すように、各ブロックA,B,C,・・・の端部を記録時間軸上の第2の時間Tbだけオーバーラップさせ、クロスフェード処理しながら連結する。このとき、ブロックAの終端側の時間Tbの部分rと、次のブロックBの先端側の時間Tbの部分fとがオーバーラップされ(重ね合わされ)、ブロックAの終端部分rがフェードアウト(徐々に減衰)し、次のブロックBの先端部分fがフェードイン(徐々に増大)するように、ブロックAとブロックBとが繋ぎ合わされる。このとき、オーバーラップ部分は第3の時間Tc(Tc=Ta−Tb)を繰り返し周期として繰り返し得られ、記録時間Taが時間Tcに圧縮されることになる。これによって、音程を変えることなく、記録時よりも高速のTa/Tc倍の再生速度で再生されることになる。   That is, the original (recording) audio signal as shown in FIG. 4A is divided into blocks for each first time Ta on the recording time axis, as shown in FIG. , The ends of the blocks A, B, C,... Overlap each other for a second time Tb on the recording time axis, and are connected while performing crossfade processing. At this time, the portion r of the time Tb on the end side of the block A and the portion f of the time Tb on the front end side of the next block B overlap (overlap), and the end portion r of the block A fades out (gradually). The block A and the block B are joined so that the leading end portion f of the next block B fades in (increases gradually). At this time, the overlap portion is repeatedly obtained with the third time Tc (Tc = Ta−Tb) as a repetition period, and the recording time Ta is compressed to the time Tc. As a result, playback is performed at a playback speed that is Ta / Tc times faster than that during recording without changing the pitch.

小川要、「デジタルフィルタ ソフトウェアによるオーディオデジタル信号処理のレシピ、PART3 特殊な信号処理、OLA」、C MAGAZINE、ソフトバンクパブリッシング株式会社、2002年3月号、p.35−36Kaname Ogawa, “Audio Digital Signal Processing Recipe with Digital Filter Software, PART3 Special Signal Processing, OLA”, C MAGAZINE, Softbank Publishing Co., Ltd., March 2002, p. 35-36 特開平8−287612号公報JP-A-8-287612

ところで、上述のように再生信号を時間領域においてブロック分割し端部をオーバーラップさせてクロスフェードしながら繋ぎ合わせるような技術においては、次のような問題点がある。   By the way, as described above, the technique in which the reproduction signal is divided into blocks in the time domain and the ends are overlapped and connected while cross-fading has the following problems.

すなわち、上記オーバーラップ部分は、元の記録時のオーディオ信号波形が重なり合うため、聴感上のゆがみとなる。全体的に良好な聴感を保つためには、分割周期とオーバーラップ部分の大きさを調整していく必要があるが、オーバーラップ部分が繰り返されることにより音程感が生じ、元の記録時のオーディオ信号に対し不快な音程差等を生じる原因となる。   In other words, the audio signal waveform at the time of original recording overlaps the above-described overlap portion, resulting in distortion in audibility. In order to maintain a good overall audibility, it is necessary to adjust the division period and the size of the overlap part. However, when the overlap part is repeated, a sense of pitch occurs, and the original recording audio This may cause an unpleasant pitch difference with respect to the signal.

また、一定の時間短縮率により、分割周期の大きさからオーバーラップ部分の大きさが必然的に決まるが、分割周期を大きくし、その結果オーバーラップ部分が大きくなると、人間の音声等では、子音が損なわれたり、発音の開始タイミングに矛盾を生じることになり、良好な音声再生が行えなくなる。   In addition, the size of the overlap part is inevitably determined from the size of the division period depending on the fixed time reduction rate, but if the division period is increased and the overlap part becomes large as a result, consonant sounds are used in human speech etc. Or the sound generation start timing becomes inconsistent, and good sound reproduction cannot be performed.

本発明は、このような従来の実情に鑑みて提案されたものであり、記録時とは異なる再生速度で再生しても音程を変えることなく、いわゆるオーバーラップ加算(OLA)のような簡易的な技術を用いながら、音声や音楽への悪影響を最小限に抑えることができるような変速再生方法及び装置、並びにプログラムを提供することを目的とする。   The present invention has been proposed in view of such a conventional situation, and does not change the pitch even when reproduced at a reproduction speed different from that at the time of recording, and is simple as in the so-called overlap addition (OLA). It is an object of the present invention to provide a variable speed reproduction method and apparatus, and a program that can minimize adverse effects on voice and music while using various technologies.

上述の課題を解決するために、本発明は、記録媒体に記録されたオーディオ信号を記録時とは異なる再生速度で再生し、再生されたオーディオ信号を記録時間軸上で分割周期としての第1の時間Taのブロックに分割し、分割された一のブロックの終端部分と次のブロックの先端部分とを記録時間軸上の第2の時間Tbでオーバーラップさせ、各オーバーラップ部分でクロスフェード処理を行うことにより連結するようにし、オーディオ信号が音声信号の場合に、上記オーバーラップ部分の繰り返し周期である第3の時間Tc(Tc=Ta−Tb)を0.05秒以上とし、上記オーバーラップ部分の第2の時間Tbを0.01秒〜0.05秒とし、オーディオ信号が音楽信号の場合に、上記分割周期である第1の時間Taを0.05秒以下とすることを特徴とする。   In order to solve the above-described problem, the present invention reproduces an audio signal recorded on a recording medium at a reproduction speed different from that at the time of recording, and the reproduced audio signal is a first divided period on the recording time axis. Are divided into blocks of time Ta, and the end portion of one divided block and the tip portion of the next block overlap at the second time Tb on the recording time axis, and crossfade processing is performed at each overlap portion. When the audio signal is an audio signal, the third time Tc (Tc = Ta−Tb), which is the repetition period of the overlap portion, is set to 0.05 seconds or more, and the overlap is performed. When the second time Tb of the portion is 0.01 seconds to 0.05 seconds and the audio signal is a music signal, the first time Ta that is the division period is 0.05 seconds or less. And wherein the Rukoto.

ここで、上記再生されたオーディオ信号が音声信号及び音楽信号を含むとき、あるいは音声信号か音楽信号かを区別できないとき、オーバーラップ部分の繰り返し周期である第3の時間Tc(Tc=Ta−Tb)を0.025秒以上とし、オーバーラップ部分の第2の時間Tbを0.005秒〜0.025秒とすることが挙げられる。   Here, when the reproduced audio signal includes an audio signal and a music signal, or when it is not possible to distinguish between the audio signal and the music signal, the third time Tc (Tc = Ta−Tb) which is the repetition period of the overlapped portion. ) Is set to 0.025 seconds or more, and the second time Tb of the overlap portion is set to 0.005 seconds to 0.025 seconds.

また、再生されたオーディオ信号が音声信号か音楽信号かを判別し、判別されたオーディオ信号の種類に応じて各時間Ta〜Tcを切り換えることが好ましい。   Further, it is preferable to determine whether the reproduced audio signal is an audio signal or a music signal, and to switch each time Ta to Tc according to the determined type of the audio signal.

また、再生速度が記録時の速度の1.3倍のとき、オーディオ信号が音声信号の場合に、オーバーラップ部分の繰り返し周期である第3の時間Tcを0.111秒とし、オーバーラップ部分の第2の時間Tbを0.033秒とし、オーディオ信号が音楽信号の場合に、分割周期である第1の時間Taを0.024秒とし、オーバーラップ部分の第2の時間Tbを0.0053秒とすることが好ましい。   When the playback speed is 1.3 times the recording speed and the audio signal is an audio signal, the third time Tc, which is the repetition period of the overlap portion, is set to 0.111 seconds, and the overlap portion In the case where the second time Tb is 0.033 seconds, and the audio signal is a music signal, the first time Ta that is a division cycle is 0.024 seconds, and the second time Tb of the overlap portion is 0.0053. Preferably it is seconds.

本発明によれば、変速再生されるオーディオ信号が音声信号の場合には、オーバーラップ部分の繰り返し周期(第3の時間)Tcを0.05秒以上とすることにより、オーバーラップ部分の繰り返しによる基本周波数成分は20Hz以下となり、人間の通常の肉声の音声信号の帯域である85Hz〜8kHzから外れているため、音声への悪影響が少なく、低域をあまり強調する必要がないBGM(バックグラウンドミュージック)に対しても影響が少ないと共に、オーバーラップ部分の時間(第2の時間)Tbを0.01秒〜0.05秒とすることにより、オーバーラップ部分をクロスフェードするときの減衰曲線が急になることによる波形歪を抑えながら、オーバーラップ部分で前後のブロックの時間関係が逆転する影響を少なくできる。また、変速再生されるオーディオ信号が音楽信号の場合には、分割周期である第1の時間Taを0.05秒以下としているため、音楽のテンポ感が良好に保たれる。さらに、変速再生されるオーディオ信号が音声信号か音楽信号か等の種類あるいはジャンルを示す属性に応じて、それぞれ適切な各時間Ta〜Tcが設定されるため、それぞれのオーディオ信号の性質を有効に保った変速再生が実現可能となる。   According to the present invention, when the audio signal to be reproduced with variable speed is an audio signal, the repetition period (third time) Tc of the overlap portion is set to 0.05 seconds or more, thereby repeating the overlap portion. Since the fundamental frequency component is 20 Hz or less and is out of the range of 85 Hz to 8 kHz, which is the normal human voice signal band, BGM (background music) that has little adverse effect on the voice and does not require much emphasis on the low frequency range. ) And the overlap portion time (second time) Tb is set to 0.01 seconds to 0.05 seconds, so that the attenuation curve when the overlap portion is crossfade is sharp. While suppressing the waveform distortion due to becoming, it is possible to reduce the influence of the time relationship of the previous and subsequent blocks in the overlapped portion is reversedFurther, when the audio signal to be played back at a variable speed is a music signal, the first time Ta, which is the division cycle, is set to 0.05 seconds or less, so that the tempo of the music is kept good. Furthermore, since each appropriate time Ta to Tc is set according to the attribute indicating the type or genre, such as whether the audio signal to be played with a variable speed is a sound signal or a music signal, the characteristics of each audio signal are effectively used. The maintained variable speed reproduction can be realized.

以下、本発明を適用した具体的な実施の形態について、図面を参照しながら詳細に説明する。   Hereinafter, specific embodiments to which the present invention is applied will be described in detail with reference to the drawings.

図1は、本発明の実施の形態に用いられる変速再生装置を概略的に示すブロック図である。この図1において、記録媒体としてのハードディスク装置11は、インターフェース(I/F)回路12を介してバス13に接続されている。このバス13には、ビデオ信号圧縮符号化/復号のための例えばMPEGエンコード/デコード回路14、オーディオ信号圧縮符号化/復号等を行うためのオーディオ処理回路21、上述したOLA(オーバーラップ加算)等を行うためのIO(入出力)プロセッサ22等が接続され、IOプロセッサ22にはバッファメモリ23が接続されている。オーディオ処理回路21からのPCM(パルスコード変調)信号や、SPDIF(Sony Philips digital interface)信号はオーディオミキサ24に送られ、オーディオミキサ24からのPCM信号はD/A変換器25でアナログ信号に変換されて端子26に送られ、オーディオミキサ24からのSPDIF信号は端子27に送られている。     FIG. 1 is a block diagram schematically showing a variable speed playback apparatus used in an embodiment of the present invention. In FIG. 1, a hard disk device 11 as a recording medium is connected to a bus 13 via an interface (I / F) circuit 12. The bus 13 includes, for example, an MPEG encoding / decoding circuit 14 for compressing / encoding / decoding a video signal, an audio processing circuit 21 for performing compressing / encoding / decoding of an audio signal, the above-described OLA (overlap addition), and the like. For example, an IO (input / output) processor 22 is connected to the IO processor 22, and a buffer memory 23 is connected to the IO processor 22. A PCM (pulse code modulation) signal and an SPDIF (Sony Philips digital interface) signal from the audio processing circuit 21 are sent to the audio mixer 24, and the PCM signal from the audio mixer 24 is converted into an analog signal by the D / A converter 25. The SPDIF signal from the audio mixer 24 is sent to the terminal 27.

図2は、上記図1の変速再生装置のオーディオ信号系をより詳細に示したブロック図であるが、オーディオ信号のみを記録再生する装置の場合には、図2の構成のみでもよく、この場合、図2は、オーディオ信号の変速再生に用いて好適な変速再生装置の一例を示すブロック図となる。   FIG. 2 is a block diagram showing the audio signal system of the variable speed reproduction apparatus of FIG. 1 in more detail. However, in the case of an apparatus for recording and reproducing only an audio signal, only the configuration of FIG. FIG. 2 is a block diagram showing an example of a variable speed reproduction apparatus suitable for variable speed reproduction of an audio signal.

この図2において、記録媒体としてのハードディスク装置11は、インターフェース(I/F)回路12に接続され、インターフェース回路12は、誤り訂正エンコード/デコード回路31及びシステムコントローラ41に接続されている。誤り訂正エンコード/デコード回路31は、音声圧縮エンコード/デコード回路32に接続されており、音声圧縮エンコード/デコード回路32からのディジタルオーディオ信号は、メモリコントローラ33を介してD/A変換器35に送られ、アナログ信号に変換されて出力端子36より取り出される。メモリコントローラ33には、バッファメモリ34が接続されている。また、入力端子38からのアナログオーディオ信号がA/D変換器37でディジタル信号に変換されて音声圧縮エンコード/デコード回路32に送られる。   In FIG. 2, a hard disk device 11 as a recording medium is connected to an interface (I / F) circuit 12, and the interface circuit 12 is connected to an error correction encoding / decoding circuit 31 and a system controller 41. The error correction encoding / decoding circuit 31 is connected to the audio compression encoding / decoding circuit 32, and the digital audio signal from the audio compression encoding / decoding circuit 32 is sent to the D / A converter 35 via the memory controller 33. And converted into an analog signal and taken out from the output terminal 36. A buffer memory 34 is connected to the memory controller 33. An analog audio signal from the input terminal 38 is converted into a digital signal by the A / D converter 37 and sent to the audio compression encoding / decoding circuit 32.

図2のシステムコントローラ41は、マイクロコンピュータを搭載して構成されており、全体の動作を管理している。このシステムコントローラ41は、キー群42からキー入力信号が与えられる。このキー群42は、電源キー、イジェクトキー、再生キー、一時停止キー、停止キー、録音キー、早送り再生キー、早戻し再生キーなどを備える。   The system controller 41 shown in FIG. 2 is configured with a microcomputer and manages the overall operation. The system controller 41 is given a key input signal from the key group 42. The key group 42 includes a power key, an eject key, a reproduction key, a pause key, a stop key, a recording key, a fast forward reproduction key, a fast reverse reproduction key, and the like.

また、オーディオ信号のみの変速再生装置の場合に、システムコントローラ41には、ディスプレイ43を接続することが好ましい。このディスプレイ43には、装着された小型光ディスクの総演奏時間、演奏中の曲の経過時間、再生中の曲の残り演奏時間、全体の残りの演奏時間等の時間情報や、演奏中の曲のトラックナンバ等が表示される。また、ディスクネームやトラックネームが記録されているディスクでは、ディスクネームやトラックネームが表示される。さらに、曲やディスクの記録日時が記録されていれば記録日時が表示される。   Further, in the case of a variable speed playback apparatus with only audio signals, it is preferable to connect a display 43 to the system controller 41. The display 43 includes time information such as the total performance time of the mounted small optical disc, the elapsed time of the song being played, the remaining performance time of the song being played back, the remaining performance time of the entire song, and the time of the song being played The track number is displayed. In the case of a disc on which a disc name or track name is recorded, the disc name or track name is displayed. Further, if the recording date / time of the song or disc is recorded, the recording date / time is displayed.

なお、図1に示したように、ビデオ信号を記録再生する変速再生装置の場合には、ビデオ信号を表示するためのビデオディスプレイ装置(図示せず)が接続されるから、このビデオディスプレイ装置に上記演奏時間等の情報を表示するようにすればよく、図2の構成を図1の変速再生装置のオーディオ信号系として用いる場合には、図2のディスプレイ43は不要となる。   As shown in FIG. 1, in the case of a variable speed playback device that records and plays back a video signal, a video display device (not shown) for displaying the video signal is connected to the video display device. Information such as the performance time may be displayed. When the configuration of FIG. 2 is used as the audio signal system of the variable speed playback apparatus of FIG. 1, the display 43 of FIG. 2 is not necessary.

また、図2のシステムコントローラ41には、再生オーディオ信号が音声信号か、音楽信号か等の種類(ジャンル)を示す属性情報として、後述するEPG(電子プログラムガイド)のジャンル情報等を検出するEPG検出回路45が接続されている。   Further, the system controller 41 of FIG. 2 detects EPG (electronic program guide) genre information and the like as attribute information indicating the type (genre) such as whether the reproduced audio signal is a sound signal or a music signal. A detection circuit 45 is connected.

オーディオ信号の記録時には、入力端子38に供給されたアナログオーディオ信号がA/D変換器37でディジタル信号に変換され、音声圧縮エンコード/デコード回路32に送られて音声圧縮符号化処理が施され、誤り訂正エンコード/デコード回路31に送られる。誤り訂正エンコード/デコード回路31で、誤り訂正用のパリティが付加され、ハードディスク用のインターフェース回路12を介してハードディスク装置11に記録される。なお、ディジタルテレビジョン放送のように予め圧縮符号化がされたデータの場合には、そのまま、あるいは必要とされる信号処理のみを施して、インターフェース回路12を介してハードディスク装置11に記録される。   At the time of recording an audio signal, the analog audio signal supplied to the input terminal 38 is converted into a digital signal by the A / D converter 37, sent to the audio compression encoding / decoding circuit 32, and subjected to audio compression encoding processing. It is sent to the error correction encoding / decoding circuit 31. The error correction encoding / decoding circuit 31 adds a parity for error correction and records it on the hard disk device 11 via the interface circuit 12 for hard disk. In the case of data that has been previously compression-encoded as in digital television broadcasting, it is recorded in the hard disk device 11 via the interface circuit 12 as it is or after being subjected to only necessary signal processing.

オーディオ信号の再生時には、上記記録時と逆の処理がなされるわけであるが、特に記録時と異なる再生速度、例えば記録時よりも高速の再生速度で再生を行う場合について、以下説明する。   When an audio signal is played back, the reverse processing to that at the time of recording is performed. In particular, a case where playback is performed at a playback speed different from that at the time of recording, for example, a playback speed higher than that at the time of recording will be described below.

変速再生時に、例えば録画したテレビジョン放送番組を早見再生する場合のような高速再生時に、図2のシステムコントローラ41は、ハードディスク装置11より、通常再生時の速度(記録速度)よりも高速に、あるいは高いレートでデータを読み出し、誤り訂正エンコード/デコード回路31で誤り訂正処理を施し、音声圧縮エンコード/デコード回路32で、圧縮符号化されたオーディオ信号の伸張復号処理を施すように制御する。この音声圧縮エンコード/デコード回路32からのオーディオ信号は、時間領域の信号となっており、メモリコントローラ33を介してバッファメモリ34に一時的に記憶させている。システムコントローラ41は、バッファメモリ34からオーディオ信号を読み出す際に、上記図4の(B)に示したように、一のブロックの終端部分rと、次のブロックの先端部分fとが時間的に重なるように(オーバーラップするように)読み出して、一のブロックの終端部分rをフェードアウト(徐々に減衰)させ、次のブロックの先端部分fがフェードイン(徐々に増大)させながら、いわゆるクロスフェードさせながら、一のブロックと次のブロックとを加算混合(ミキシング)することにより、一のブロックと次のブロックとを滑らかに繋ぎ合わせている。図4の(B)では、例えばブロックBの終端部分rをフェードアウトさせ、次のブロックCの先端部分fをフェードインさせてミキシングし、ブロックBとブロックCとを滑らかに連結している。   At the time of variable speed reproduction, for example, at the time of high-speed reproduction such as when the recorded television broadcast program is quickly reproduced, the system controller 41 in FIG. 2 is faster than the speed (recording speed) during normal reproduction from the hard disk device 11. Alternatively, data is read at a high rate, error correction processing is performed by the error correction encoding / decoding circuit 31, and control is performed so that the audio compression encoding / decoding circuit 32 performs decompression decoding processing of the compression-coded audio signal. The audio signal from the audio compression encoding / decoding circuit 32 is a time-domain signal and is temporarily stored in the buffer memory 34 via the memory controller 33. When the system controller 41 reads the audio signal from the buffer memory 34, the end portion r of one block and the end portion f of the next block are temporally separated as shown in FIG. Reading so as to overlap (overlapping), the end portion r of one block fades out (gradually decays), and the leading end f of the next block fades in (gradually increases), so-called crossfade In addition, the one block and the next block are smoothly connected by adding and mixing (mixing) the one block and the next block. In FIG. 4B, for example, the end portion r of the block B is faded out, the front end portion f of the next block C is faded in and mixed, and the block B and the block C are smoothly connected.

ここで、再生されたオーディオ信号のブロック分割周期としての記録時間軸上での第1の時間をTaとし、分割された一のブロックの終端及び次のブロックの先端でのオーバーラップ部分の記録時間軸上の第2の時間をTbとするとき、オーバーラップ部分は第3の時間Tc(Tc=Ta−Tb)を周期として繰り返されることになり、記録時の第1の時間Taのデータが第3の時間Tcに圧縮されて再生されたことになる。この場合の再生速度は、記録時の速度(標準再生速度)のTa/Tc倍である。   Here, Ta is the first time on the recording time axis as the block division period of the reproduced audio signal, and the recording time of the overlapped portion at the end of one divided block and the tip of the next block When the second time on the axis is Tb, the overlap portion is repeated with the period of the third time Tc (Tc = Ta−Tb), and the data of the first time Ta at the time of recording is the first. It is compressed and reproduced at time Tc of 3. In this case, the reproduction speed is Ta / Tc times the recording speed (standard reproduction speed).

再生されるオーディオ信号が人の音声(speech sound)である場合には、上記オーバーラップ部分の繰り返し周波数(1/Tc)が、一般に有効とされる音声帯域(例えば85Hz〜8kHz)から外れていることが望ましく、また、倍音による影響も小さくしたいことを考慮し、1/Tcを20Hz以下、すなわち、第3の時間Tcを0.05秒以上とする。この場合、オーバーラップ部分の繰り返しによる基本周波数成分が20Hz以下となり、倍音の2〜3次高調波程度までは、音声帯域の下限、例えば85Hzよりも低くなるため、音声帯域に与える悪影響を極力小さく抑えることができる。また、オーバーラップ部分の長さである第2の時間Tbについては、短かすぎるとクロスフェードのための減衰曲線が急峻となり、ブロック端部のオーディオ信号波形を歪ませる影響が無視できなくなることを考慮して、0.01秒以上とし、長すぎると、前のブロックの終端で発生した音が次のブロックの先端で発生した音よりも遅れることによる時間の逆転現象が聴感上無視できなくなることを考慮し、0.05秒以下とした。このように、オーバーラップ部分の長さである第2の時間Tbを0.01秒〜0.05秒とすることにより、ブロック端部での波形の歪も少なく、オーバーラップ部分での時間の逆転現象も聴感上問題ない程度に抑えられる。なお、この音声信号の場合、ブロック分割周期である第1の時間Taは、Ta=Tc+Tbより、0.06秒以上となる。   When the reproduced audio signal is a human sound (speech sound), the repetition frequency (1 / Tc) of the overlap portion is out of the generally effective voice band (for example, 85 Hz to 8 kHz). Considering that it is desirable to reduce the influence of overtones, 1 / Tc is set to 20 Hz or less, that is, the third time Tc is set to 0.05 seconds or more. In this case, the fundamental frequency component due to repetition of the overlap portion is 20 Hz or less, and is lower than the lower limit of the voice band, for example, 85 Hz, up to about the second to third harmonics of overtones. Can be suppressed. On the other hand, if the second time Tb, which is the length of the overlap portion, is too short, the attenuation curve for crossfading becomes steep, and the influence of distorting the audio signal waveform at the block end cannot be ignored. Considering that, if it is 0.01 seconds or longer and is too long, the reversal of time caused by the sound generated at the end of the previous block being delayed from the sound generated at the end of the next block cannot be ignored for hearing. In consideration of the above, it was set to 0.05 seconds or less. In this way, by setting the second time Tb, which is the length of the overlap portion, to 0.01 seconds to 0.05 seconds, the waveform distortion at the block end is small, and the time at the overlap portion is reduced. The reversal phenomenon is also suppressed to the extent that there is no problem with hearing. In the case of this audio signal, the first time Ta, which is the block division period, is 0.06 seconds or more from Ta = Tc + Tb.

これに対して、音楽番組等を早見再生するような、再生されるオーディオ信号が主として音楽(music)の場合には、上記音声信号の場合の各時間Ta〜Tc等の設定では、音楽のテンポ感が損なわれる。すなわち、音楽の場合には、音符の長さが正確に再現されることが重要であり、上記音声信号のように分割周期Taが0.06秒以上もあると、上記分割ブロックの長さが最短の音符の時間に近付いたり最短の音符よりも長くなったりするため、オーバーラップ加算すると音符の長さが不正確となり、テンポ感あるいはリズム感が乱されることになる。この点を考慮して、音楽信号の場合のブロック分割周期(第1の時間)Taを、0.05秒以下としている。また、オーバーラップ部分の長さ(第2の時間)Tbについては、再生速度が何倍速かによるが、例えば1.3倍速再生の場合には、第2の時間Tbは0.12秒以下となる。このように、第1の時間Taや第2の時間Tbを短くする場合に、オーバーラップ部分の繰り返し周波数による低域や中域の周波数帯域への影響や、オーバーラップ部分での波形歪による高域周波数を含む音質への影響が無視できなくなるが、音楽信号を上述したようなOLA(オーバーラップ加算)によって処理する場合には何らかの音質への影響は避けられないことから、音楽番組等を早見再生するような場合には曲のテンポ感あるいはリズム感が保たれることが最も重要である点を考慮し、上述のように、第1の時間Taを0.05秒以下としたものである。   On the other hand, when the audio signal to be reproduced is mainly music (music), for example, when a music program is played at a high speed, the tempo of the music is set for each time Ta to Tc in the case of the audio signal. The feeling is impaired. That is, in the case of music, it is important that the lengths of the notes are accurately reproduced. If the division period Ta is 0.06 seconds or more as in the case of the audio signal, the length of the division block is reduced. Since it approaches the time of the shortest note or becomes longer than the shortest note, if the overlap is added, the length of the note becomes inaccurate, and the sense of tempo or rhythm is disturbed. Considering this point, the block division period (first time) Ta in the case of a music signal is set to 0.05 seconds or less. The overlap portion length (second time) Tb depends on how many times the playback speed is. For example, in the case of 1.3 times speed playback, the second time Tb is 0.12 seconds or less. Become. As described above, when the first time Ta and the second time Tb are shortened, the influence of the repetition frequency of the overlap portion on the low frequency band and the middle frequency band, and the waveform distortion at the overlap portion are high. Although the influence on the sound quality including the frequency band cannot be ignored, if the music signal is processed by the OLA (overlap addition) as described above, the influence on the sound quality is unavoidable. In consideration of the point that it is most important that the tempo or rhythm of the song is maintained in the case of reproduction, the first time Ta is set to 0.05 seconds or less as described above. .

また、音楽バラエティ番組やミュージカル等のように音声と音楽とが混在しいずれも重要な場合や、音声か音楽かの判別がつきにくいような場合には、上記各時間Ta〜Tcとしては、上記音声の場合と音楽の場合の中間的な値に設定することが好ましい。この点を考慮し、再生されたオーディオ信号が音声信号及び音楽信号を含むとき、あるいは音声信号か音楽信号かを区別できないとき、オーバーラップ部分の繰り返し周期である第3の時間Tcを0.025秒以上とし、オーバーラップ部分の長さである第2の時間Tbを0.005秒〜0.025秒とするようにしている。   In addition, when the voice and music are both mixed and important, such as music variety programs and musicals, or when it is difficult to distinguish between voice and music, each of the times Ta to Tc is as described above. It is preferable to set an intermediate value between audio and music. Considering this point, when the reproduced audio signal includes an audio signal and a music signal, or when it is not possible to distinguish between the audio signal and the music signal, the third time Tc that is the repetition period of the overlap portion is set to 0.025. The second time Tb, which is the length of the overlap portion, is set to 0.005 seconds to 0.025 seconds.

このように、早見再生等により高速再生される番組の種類あるいはジャンルにより、オーディオ信号をOLA(オーバーラップ加算)処理するときの各時間Ta〜Tcの適切な値が異なることを考慮し、番組の種類あるいはジャンルにより各時間Ta〜Tcを切換制御することが好ましい。具体的には、人間が再生される番組等の種類やジャンルを判断して、図2のキー群42を手動操作することにより、システムコントローラ41に各時間Ta〜Tcの値を切り換え制御させることが挙げられる。また、テレビジョン放送番組のいわゆるEPG(電子プログラムガイド)を得ることができる場合には、図2のEPG検出回路45により、EPG情報中の番組の種類やジャンルを示す属性情報を抽出し、これをシステムコントローラ41に送ることにより、各時間Ta〜Tcの値を切換制御するようにしてもよい。   In this way, considering that the appropriate value of each time Ta to Tc when the audio signal is subjected to OLA (overlap addition) processing differs depending on the type or genre of the program that is reproduced at high speed by fast-viewing reproduction, etc. It is preferable to switch and control each time Ta to Tc depending on the type or genre. Specifically, the type and genre of a program to be played back by a human being is judged, and the key group 42 in FIG. 2 is manually operated to cause the system controller 41 to switch and control the values of each time Ta to Tc. Is mentioned. If a so-called EPG (electronic program guide) of a television broadcast program can be obtained, attribute information indicating the type and genre of the program in the EPG information is extracted by the EPG detection circuit 45 of FIG. May be controlled to switch the values of the respective times Ta to Tc.

次に、本発明の実施の形態を、ビデオ信号のいわゆるハードディスクレコーダ等に適用する場合に、撮り溜めたテレビジョン放送番組等を早見再生する用途が考えられ、この場合の再生速度は2倍程度までであるが、さらに番組内容をある程度楽しめるような再生速度としては、1.3〜1.5倍速程度が考えられる。以下に具体例として、再生速度を記録時の速度(標準再生速度)の1.3倍とした場合のベストチューニングの各時間Ta〜Tcの例を挙げる。   Next, when the embodiment of the present invention is applied to a so-called hard disk recorder or the like of a video signal, it can be used to quickly reproduce a television broadcast program that has been collected, and the reproduction speed in this case is about double. However, as a playback speed that can further enjoy the contents of the program to some extent, about 1.3 to 1.5 times speed can be considered. As a specific example, examples of best tuning times Ta to Tc when the playback speed is 1.3 times the recording speed (standard playback speed) will be given below.

標準の1.3倍速で再生されたオーディオ信号が音声信号の場合、オーバーラップ部分の繰り返し周期である第3の時間Tcを0.111秒とし、オーバーラップ部分の長さである第2の時間Tbを0.033秒とする。このとき、オーバーラップ部分の繰り返しによる基本周波数成分は約9Hzとなり、人間の音声の帯域である85Hz〜8kHzの最低域よりも十分に低いため、数次程度の高調波も含めて、音声への悪影響が少なく、低域をあまり強調する必要がないBGM(バックグラウンドミュージック)に対しても影響が少ない。また、オーバーラップ部分の長さ(第2の時間)Tbは0.033秒であるため、オーバーラップ部分をクロスフェードするときの減衰曲線が急になることによる波形歪を抑えながら、オーバーラップ部分で前後のブロックの時間関係が逆転する影響を少なくできる。   When the audio signal reproduced at the standard 1.3 times speed is an audio signal, the third time Tc that is the repetition period of the overlap portion is set to 0.111 seconds, and the second time that is the length of the overlap portion. Tb is set to 0.033 seconds. At this time, the fundamental frequency component due to the repetition of the overlap portion is about 9 Hz, which is sufficiently lower than the lowest frequency range of 85 Hz to 8 kHz, which is the human voice band, and therefore includes harmonics of several orders. There is little adverse effect, and there is little influence on BGM (background music) that does not need to emphasize the low range too much. In addition, since the length (second time) Tb of the overlap portion is 0.033 seconds, the overlap portion is suppressed while suppressing waveform distortion due to a steep attenuation curve when the overlap portion is crossfade. Can reduce the influence of the time relationship between the previous and next blocks being reversed.

標準の1.3倍速で再生されたオーディオ信号が音楽信号の場合には、ブロック分割周期である第1の時間Taを0.024秒とし、オーバーラップ部分の長さである第2の時間Tbを0.0053秒とする。ここで、テンポの非常に速い曲として、一分間に四分音符で250(M.M.=250)程度の曲を想定する場合、四分音符の長さが0.24秒であり、一六分音符でも0.06秒であるから、ブロック分割周期が0.024秒であれば、四分音符は10個程度のブロックに分割され、16分音符でも2〜3個程度のブロックに分割され、OLA(オーバーラップ加算)によるテンポ感あるいはリズム感の乱れは殆ど感じられないものとなる。   When the audio signal reproduced at the standard 1.3 times speed is a music signal, the first time Ta that is the block division period is set to 0.024 seconds, and the second time Tb that is the length of the overlap portion. Is 0.0053 seconds. Here, when assuming a tune of about 250 (MM = 250) with one quarter note as a song with a very fast tempo, the length of the quarter note is 0.24 seconds, Since the sixth note is 0.06 seconds, if the block division period is 0.024 seconds, the quarter note is divided into about 10 blocks, and even the 16th note is divided into about 2 to 3 blocks. Thus, the tempo or rhythmic disturbance due to OLA (overlap addition) is hardly felt.

従って、図2のシステムコントローラ41は、人間がジャンルを判断してキー群42を操作することに応じて、あるいはEPG検出回路45からのジャンル情報に応じて、上記オーディオ信号をOLA(オーバーラップ加算)処理するときの各時間Ta〜Tcを切換制御しており、高速再生される番組がニュースやドラマ等の音声信号が重要とされるジャンルの場合には、オーバーラップ部分の繰り返し周期である第3の時間Tcを0.111秒に、オーバーラップ部分の長さである第2の時間Tbを0.033秒に切換制御し、また、高速再生される番組が音楽番組等の音楽信号が重要なジャンルの場合には、分割周期である第1の時間Taを0.024秒に、オーバーラップ部分の長さである第2の時間Tbを0.0053秒に切換制御する。   Therefore, the system controller 41 in FIG. 2 outputs the audio signal in accordance with OLA (overlap addition) in response to a human operating the key group 42 by determining the genre or according to the genre information from the EPG detection circuit 45. ) When the time Ta to Tc for processing is controlled to be switched, and the program to be played back at high speed is a genre in which audio signals such as news and dramas are important, the repetition period of the overlap portion The time Tc of 3 is switched to 0.111 seconds and the second time Tb, which is the length of the overlap portion, is controlled to be switched to 0.033 seconds. In the case of a different genre, the first time Ta, which is the division cycle, is switched to 0.024 seconds, and the second time Tb, which is the length of the overlap portion, is switched to 0.0053 seconds. That.

これによって、高速再生される番組のオーディオ信号に最適なOLA(オーバーラップ加算)処理が行われ、簡単な構成にも拘わらず音程を変えずに良好なオーディオ信号を聴取できる。   As a result, an optimal OLA (overlap addition) process is performed on the audio signal of the program to be played back at high speed, and a good audio signal can be heard without changing the pitch despite the simple configuration.

次に、図3は本発明の実施の形態となる変速再生方法の動作を説明するためのフローチャートである。この図3において、ステップS1で変速再生、例えば上述した早見再生により、オーディオ信号を標準再生速度(記録速度)よりも高速(例えば1.3倍速)で再生する。   Next, FIG. 3 is a flowchart for explaining the operation of the variable speed reproduction method according to the embodiment of the present invention. In FIG. 3, the audio signal is reproduced at a higher speed (eg, 1.3 times faster) than the standard reproduction speed (recording speed) by variable speed reproduction at step S1, for example, the above-mentioned quick-reproduction.

次のステップS2では、高速再生された信号の種類やジャンルに応じて、例えばオーディオ信号が音声を主体とするものか音楽を主体とするものかに応じて、上記各時間Ta,Tb,Tcを決定する。具体的に、例えば1.3倍の早見再生の場合においては、図2のシステムコントローラ41により、音声信号の場合はオーバーラップ部分の繰り返し周期(第3の時間Tc)を0.111秒に、オーバーラップ部分の長(第2の時間Tb)を0.033秒に切換制御し、また、音楽信号の場合には、分割周期(第1の時間Ta)を0.024秒に、オーバーラップ部分の長さ(第2の時間Tb)を0.0053秒に切換制御する。一般的には、再生オーディオ信号が音声信号の場合に、オーバーラップ部分の繰り返し周期である第3の時間Tcを0.05秒以上とし、オーバーラップ部分の長さである第2の時間Tbを0.01秒〜0.05秒とし、再生オーディオ信号が音楽信号の場合に、上記分割周期である第1の時間Taを0.05秒以下とする。また、再生されたオーディオ信号が音声信号及び音楽信号を含むとき、あるいは音声信号か音楽信号かを区別できないとき、オーバーラップ部分の繰り返し周期である第3の時間Tcを0.025秒以上とし、オーバーラップ部分の長さである第2の時間Tbを0.005秒〜0.025秒とする。   In the next step S2, the respective times Ta, Tb, Tc are determined according to the type and genre of the signal reproduced at high speed, for example, depending on whether the audio signal is mainly voice or music. decide. Specifically, for example, in the case of 1.3 times quick playback, the system controller 41 in FIG. 2 sets the repetition period (third time Tc) of the overlap portion to 0.111 seconds in the case of an audio signal. The overlap portion length (second time Tb) is controlled to be switched to 0.033 seconds. In the case of a music signal, the division period (first time Ta) is set to 0.024 seconds, and the overlap portion is Is switched to 0.0053 seconds (second time Tb). In general, when the reproduced audio signal is an audio signal, the third time Tc, which is the repetition period of the overlap portion, is set to 0.05 seconds or more, and the second time Tb, which is the length of the overlap portion, is set. When the playback audio signal is a music signal, the first time Ta, which is the division period, is set to 0.05 seconds or less. When the reproduced audio signal includes a voice signal and a music signal, or when it is not possible to distinguish between the voice signal and the music signal, the third time Tc that is the repetition period of the overlap portion is set to 0.025 seconds or more, The second time Tb that is the length of the overlap portion is set to 0.005 seconds to 0.025 seconds.

次のステップS3では、ブロック分割周期である記録時間軸上の第1の時間Ta毎にオーディオ信号をブロック分割し、次のステップS4で、各ブロックの端部を記録時間軸上のそれぞれ第2の時間Tbだけオーバーラップさせると共にクロスフェード処理して連結する。   In the next step S3, the audio signal is divided into blocks for each first time Ta on the recording time axis which is a block division cycle, and in the next step S4, the end of each block is set to the second time on the recording time axis. Are overlapped only for a time Tb and connected by crossfading.

上述したような本発明の実施の形態によれば、変速再生されるオーディオ信号が音声信号の場合には、オーバーラップ部分の繰り返しによる基本周波数成分は十分に低くなり、人間の音声の帯域である85Hz〜8kHzから外れているため、音声への悪影響が少なく、低域をあまり強調する必要がないBGM(バックグラウンドミュージック)に対しても影響が少ないと共に、オーバーラップ部分をクロスフェードするときの減衰曲線が急になることによる波形歪を抑えながら、オーバーラップ部分で前後のブロックの時間関係が逆転する影響を少なくできる。また、変速再生されるオーディオ信号が音楽信号の場合には、音楽のテンポ感が良好に保たれる。さらに、変速再生されるオーディオ信号が音声信号及び音楽信号を含むとき、あるいは音声信号か音楽信号かを区別できないときには、音声への影響もある程度抑えながら、音楽のテンポ感も適度に保たれるような再生が行える。このように、変速再生されるオーディオ信号が音声信号か音楽信号か等の種類あるいはジャンルを示す属性に応じて、それぞれ適切な各時間Ta〜Tcが設定されるため、それぞれのオーディオ信号の性質を良好に保った変速再生が実現可能となる。   According to the embodiment of the present invention as described above, when the audio signal to be played back at a variable speed is an audio signal, the fundamental frequency component due to the repetition of the overlap portion is sufficiently low, which is a human audio band. Since it is outside the range of 85Hz to 8kHz, there is little adverse effect on the sound, there is little effect on BGM (background music) that does not need to emphasize the low range too much, and attenuation when cross-fading the overlap part While suppressing the waveform distortion due to the steep curve, the influence of reversing the time relationship between the preceding and succeeding blocks in the overlap portion can be reduced. Further, when the audio signal to be played back at a variable speed is a music signal, the tempo of the music is kept good. Furthermore, when the audio signal to be played back at a variable speed includes a sound signal and a music signal, or when it cannot be distinguished whether it is a sound signal or a music signal, the tempo of the music is kept moderate while suppressing the influence on the sound to some extent. Playback is possible. As described above, since the appropriate times Ta to Tc are set according to the attribute indicating the type or genre such as whether the audio signal to be reproduced with a variable speed is an audio signal or a music signal, the properties of the respective audio signals are set. It is possible to realize variable speed reproduction while maintaining good conditions.

なお、本発明は上述した実施の形態のみに限定されるものではなく、本発明の要旨を逸脱しない範囲において種々の変更が可能であることは勿論である。   It should be noted that the present invention is not limited to the above-described embodiments, and various modifications can be made without departing from the scope of the present invention.

本発明の実施の形態となる変速再生装置の概略構成を示すブロック図である。1 is a block diagram showing a schematic configuration of a variable speed playback device according to an embodiment of the present invention. 本発明の実施の形態における変速再生装置のオーディオ信号系の構成例を示すブロック図である。It is a block diagram which shows the structural example of the audio signal type | system | group of the variable speed reproduction apparatus in embodiment of this invention. 本発明の実施の形態となる変速再生方法を説明するためのフローチャートである。It is a flowchart for demonstrating the speed-change reproduction | regeneration method used as embodiment of this invention. 音声を変えずに変速再生するためのOLA(オーバーラップ加算)の技術を説明するための説明図である。It is explanatory drawing for demonstrating the technique of OLA (overlap addition) for carrying out variable speed reproduction, without changing an audio | voice.

符号の説明Explanation of symbols

11 ハードディスク装置、 12 インターフェース(I/F)回路、 14 MPEGエンコード/デコード回路、 21 オーディオ処理回路、 22 IO(入出力)プロセッサ、 23 バッファメモリ、 31 誤り訂正エンコード/デコード回路、 32 音声圧縮エンコード/デコード回路、 33 メモリコントローラ、 34 バッファメモリ、 41 システムコントローラ、 42 キー群、 43 ディスプレイ、 45 EPG検出回路

11 hard disk drive, 12 interface (I / F) circuit, 14 MPEG encoding / decoding circuit, 21 audio processing circuit, 22 IO (input / output) processor, 23 buffer memory, 31 error correction encoding / decoding circuit, 32 audio compression encoding / decoding Decode circuit, 33 memory controller, 34 buffer memory, 41 system controller, 42 key group, 43 display, 45 EPG detection circuit

Claims (10)

記録媒体に記録されたオーディオ信号を記録時とは異なる再生速度で再生する再生工程と、
上記再生されたオーディオ信号を記録時間軸上で分割周期としての第1の時間Taのブロックに分割する分割工程と、
上記分割された一のブロックの終端部分と次のブロックの先端部分とを記録時間軸上の第2の時間Tbでオーバーラップさせ、各オーバーラップ部分でクロスフェード処理を行うことにより連結する連結工程とを有し、
上記オーディオ信号が音声信号の場合に、上記オーバーラップ部分の繰り返し周期である第3の時間Tc(Tc=Ta−Tb)を0.05秒以上とし、上記オーバーラップ部分の第2の時間Tbを0.01秒〜0.05秒とし、
上記オーディオ信号が音楽信号の場合に、上記分割周期である第1の時間Taを0.05秒以下とすること
を特徴とするオーディオ信号の変速再生方法。
A reproduction step of reproducing the audio signal recorded on the recording medium at a reproduction speed different from that at the time of recording;
A division step of dividing the reproduced audio signal into blocks of a first time Ta as a division period on the recording time axis;
A connecting step in which the end portion of the divided one block and the leading end portion of the next block are overlapped at a second time Tb on the recording time axis, and crossover processing is performed at each overlap portion. And
When the audio signal is an audio signal, the third time Tc (Tc = Ta−Tb), which is the repetition period of the overlap portion, is set to 0.05 seconds or more, and the second time Tb of the overlap portion is set. 0.01 seconds to 0.05 seconds,
When the audio signal is a music signal, the first time Ta, which is the division period, is set to 0.05 seconds or less.
上記再生されたオーディオ信号が音声信号及び音楽信号を含むとき、あるいは音声信号か音楽信号かを区別できないとき、
上記オーバーラップ部分の繰り返し周期である第3の時間Tc(Tc=Ta−Tb)を0.025秒以上とし、上記オーバーラップ部分の第2の時間Tbを0.005秒〜0.025秒とすること
を特徴とする請求項1記載の変速再生方法。
When the reproduced audio signal includes an audio signal and a music signal, or when it is not possible to distinguish between an audio signal and a music signal,
A third time Tc (Tc = Ta−Tb) that is a repetition period of the overlap portion is set to 0.025 seconds or more, and a second time Tb of the overlap portion is set to 0.005 seconds to 0.025 seconds. The variable speed reproduction method according to claim 1, wherein:
上記再生されたオーディオ信号が音声信号か音楽信号かを判別する判別工程を有し、
この判別工程により判別されたオーディオ信号の種類に応じて上記各時間Ta〜Tcを切り換えること
を特徴とする請求項1記載の変速再生方法。
A determination step of determining whether the reproduced audio signal is an audio signal or a music signal;
2. The variable speed reproduction method according to claim 1, wherein the times Ta to Tc are switched in accordance with the type of the audio signal discriminated in the discriminating step.
上記再生速度が上記記録時の速度の1.3倍のとき、
上記オーディオ信号が音声信号の場合に、上記オーバーラップ部分の繰り返し周期である第3の時間Tcを0.111秒とし、上記オーバーラップ部分の第2の時間Tbを0.033秒とし、
上記オーディオ信号が音楽信号の場合に、上記分割周期である第1の時間Taを0.024秒とし、上記オーバーラップ部分の第2の時間Tbを0.0053秒とすること
を特徴とする請求項1記載の変速再生方法。
When the playback speed is 1.3 times the recording speed,
When the audio signal is an audio signal, the third time Tc that is the repetition period of the overlap portion is set to 0.111 seconds, the second time Tb of the overlap portion is set to 0.033 seconds,
When the audio signal is a music signal, the first time Ta, which is the division period, is set to 0.024 seconds, and the second time Tb of the overlap portion is set to 0.0053 seconds. Item 4. The variable speed reproduction method according to Item 1.
記録媒体に記録されたオーディオ信号を記録時とは異なる再生速度で再生する再生手段と、
上記再生されたオーディオ信号を記録時間軸上で分割周期としての第1の時間Taのブロックに分割し、上記分割された一のブロックの終端部分と次のブロックの先端部分とを記録時間軸上の第2の時間Tbでオーバーラップさせ、各オーバーラップ部分でクロスフェード処理を行うことにより連結する制御手段とを有し、
上記制御手段は、上記オーディオ信号が音声信号の場合に、上記オーバーラップ部分の繰り返し周期である第3の時間Tc(Tc=Ta−Tb)を0.05秒以上とし、上記オーバーラップ部分の第2の時間Tbを0.01秒〜0.05秒とし、上記オーディオ信号が音楽信号の場合に、上記分割周期である第1の時間Taを0.05秒以下とすること
を特徴とするオーディオ信号の変速再生装置。
Reproduction means for reproducing the audio signal recorded on the recording medium at a reproduction speed different from that at the time of recording;
The reproduced audio signal is divided into blocks of the first time Ta as a division period on the recording time axis, and the end portion of the divided one block and the leading end portion of the next block are recorded on the recording time axis. And a control means for connecting by overlapping each other at a second time Tb and performing a cross-fade process at each overlapping portion,
When the audio signal is an audio signal, the control means sets a third time Tc (Tc = Ta−Tb), which is a repetition period of the overlap portion, to be 0.05 seconds or more, and sets the third time of the overlap portion. The time Tb of 2 is 0.01 seconds to 0.05 seconds, and when the audio signal is a music signal, the first time Ta that is the division period is 0.05 seconds or less. A variable speed signal reproduction device.
上記制御手段は、上記再生されたオーディオ信号が音声信号及び音楽信号を含むとき、あるいは音声信号か音楽信号かを区別できないとき、上記オーバーラップ部分の繰り返し周期である第3の時間Tc(Tc=Ta−Tb)を0.025秒以上とし、上記オーバーラップ部分の第2の時間Tbを0.005秒〜0.025秒とすること
を特徴とする請求項5記載の変速再生装置。
When the reproduced audio signal includes a sound signal and a music signal, or when the control means cannot distinguish between the sound signal and the music signal, the control means performs a third time Tc (Tc = Tc = Tc = the repetition period of the overlap portion). 6. The variable speed playback apparatus according to claim 5, wherein Ta-Tb) is set to 0.025 seconds or longer, and the second time Tb of the overlap portion is set to 0.005 seconds to 0.025 seconds.
上記制御手段は、上記再生されたオーディオ信号が音声信号か音楽信号かを判別し、判別されたオーディオ信号の種類に応じて上記各時間Ta〜Tcを切り換えること
を特徴とする請求項5記載の変速再生装置。
The said control means discriminate | determines whether the said reproduced audio signal is an audio | voice signal or a music signal, and switches said each time Ta-Tc according to the discriminated type of the audio signal. Variable speed playback device.
上記制御手段は、上記再生速度が上記記録時の速度の1.3倍のとき、上記オーディオ信号が音声信号の場合に、上記オーバーラップ部分の繰り返し周期である第3の時間Tcを0.111秒とし、上記オーバーラップ部分の第2の時間Tbを0.033秒とし、上記オーディオ信号が音楽信号の場合に、上記分割周期である第1の時間Taを0.024秒とし、上記オーバーラップ部分の第2の時間Tbを0.0053秒とすること
を特徴とする請求項5記載の変速再生装置。
When the reproduction speed is 1.3 times the recording speed and the audio signal is an audio signal, the control means sets a third time Tc that is a repetition period of the overlap portion to 0.111. Second, the second time Tb of the overlap portion is 0.033 seconds, and when the audio signal is a music signal, the first time Ta as the division period is 0.024 seconds, and the overlap 6. The variable speed playback apparatus according to claim 5, wherein the second time Tb of the portion is set to 0.0053 seconds.
記録媒体に記録されたオーディオ信号を記録時とは異なる再生速度で再生制御する再生工程と、
上記再生されたオーディオ信号の種類を示す属性情報を検出する属性検出工程と、
上記再生されたオーディオ信号を記録時間軸上で分割周期としての第1の時間Taのブロックに分割する分割工程と、
上記分割された一のブロックの終端部分と次のブロックの先端部分とを記録時間軸上の第2の時間Tbでオーバーラップさせ、各オーバーラップ部分でクロスフェード処理を行うことにより連結する連結工程とを有し、
上記検出された属性情報に応じて、上記分割周期である第1の時間Ta及び上記オーバーラップ部分の第2の時間Tbを切換制御すること
を特徴とする変速再生方法。
A reproduction step of controlling reproduction of the audio signal recorded on the recording medium at a reproduction speed different from that at the time of recording;
An attribute detection step of detecting attribute information indicating the type of the reproduced audio signal;
A division step of dividing the reproduced audio signal into blocks of a first time Ta as a division period on the recording time axis;
A connecting step in which the end portion of the divided one block and the leading end portion of the next block are overlapped at a second time Tb on the recording time axis, and crossover processing is performed at each overlap portion. And
According to the detected attribute information, the variable speed reproduction method characterized by switching and controlling the first time Ta which is the division period and the second time Tb of the overlap portion.
コンピュータに、
記録媒体に記録されたオーディオ信号を記録時とは異なる再生速度で再生制御する手順と、
上記再生されたオーディオ信号を記録時間軸上で分割周期としての第1の時間Taのブロックに分割する手順と、
上記分割された一のブロックの終端部分と次のブロックの先端部分とを記録時間軸上の第2の時間Tbでオーバーラップさせ、各オーバーラップ部分でクロスフェード処理を行うことにより連結する手順と
を実行させるためのプログラムであって、
上記オーディオ信号が音声信号の場合に、上記オーバーラップ部分の繰り返し周期である第3の時間Tc(Tc=Ta−Tb)を0.05秒以上とし、上記オーバーラップ部分の第2の時間Tbを0.01秒〜0.05秒とし、
上記オーディオ信号が音楽信号の場合に、上記分割周期である第1の時間Taを0.05秒以下とすること
を特徴とするプログラム。

On the computer,
A procedure for controlling playback of an audio signal recorded on a recording medium at a playback speed different from that at the time of recording;
Dividing the reproduced audio signal into blocks of a first time Ta as a division period on the recording time axis;
A procedure for connecting the end portion of the divided one block and the leading end portion of the next block at a second time Tb on the recording time axis and performing cross-fade processing at each overlap portion; A program for executing
When the audio signal is an audio signal, the third time Tc (Tc = Ta−Tb), which is the repetition period of the overlap portion, is set to 0.05 seconds or more, and the second time Tb of the overlap portion is set. 0.01 seconds to 0.05 seconds,
When the audio signal is a music signal, the first time Ta as the division period is set to 0.05 seconds or less.

JP2004081498A 2004-03-19 2004-03-19 Variable speed reproduction method and apparatus, and program Expired - Fee Related JP4542805B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004081498A JP4542805B2 (en) 2004-03-19 2004-03-19 Variable speed reproduction method and apparatus, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004081498A JP4542805B2 (en) 2004-03-19 2004-03-19 Variable speed reproduction method and apparatus, and program

Publications (2)

Publication Number Publication Date
JP2005266571A true JP2005266571A (en) 2005-09-29
JP4542805B2 JP4542805B2 (en) 2010-09-15

Family

ID=35091157

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004081498A Expired - Fee Related JP4542805B2 (en) 2004-03-19 2004-03-19 Variable speed reproduction method and apparatus, and program

Country Status (1)

Country Link
JP (1) JP4542805B2 (en)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007304515A (en) * 2006-05-15 2007-11-22 Sony Corp Audio signal decompressing and compressing method and device
JP2008058956A (en) * 2006-07-31 2008-03-13 Matsushita Electric Ind Co Ltd Speech reproduction device
JP2011007959A (en) * 2009-06-24 2011-01-13 Ge Medical Systems Global Technology Co Llc Speech data processing device, magnetic resonance imaging device, speech data processing method and program
US7894654B2 (en) 2008-07-08 2011-02-22 Ge Medical Systems Global Technology Company, Llc Voice data processing for converting voice data into voice playback data
US8484018B2 (en) 2009-08-21 2013-07-09 Casio Computer Co., Ltd Data converting apparatus and method that divides input data into plural frames and partially overlaps the divided frames to produce output data
CN113643728A (en) * 2021-08-12 2021-11-12 荣耀终端有限公司 Audio recording method, electronic device, medium, and program product

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06202692A (en) * 1993-01-06 1994-07-22 Nippon Telegr & Teleph Corp <Ntt> Control system for speech reproducing speed
JPH08287612A (en) * 1995-04-14 1996-11-01 Sony Corp Variable speed reproducing method for audio data
JPH09146587A (en) * 1995-11-28 1997-06-06 Sanyo Electric Co Ltd Speech speed changer
JPH09330094A (en) * 1996-06-10 1997-12-22 Takako Ito Voice reproducing device with variable tempo function
JPH10282991A (en) * 1997-04-02 1998-10-23 Matsushita Graphic Commun Syst Inc Speech rate converting device
JP2001255876A (en) * 2000-03-13 2001-09-21 Yamaha Corp Method for expanding and compressing musical sound waveform signal in time base direction
JP2001282297A (en) * 2000-03-29 2001-10-12 Pioneer Electronic Corp Method and device for reproducing sound information
JP2005535915A (en) * 2002-08-08 2005-11-24 コスモタン インク Time scale correction method of audio signal using variable length synthesis and correlation calculation reduction technique

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06202692A (en) * 1993-01-06 1994-07-22 Nippon Telegr & Teleph Corp <Ntt> Control system for speech reproducing speed
JPH08287612A (en) * 1995-04-14 1996-11-01 Sony Corp Variable speed reproducing method for audio data
JPH09146587A (en) * 1995-11-28 1997-06-06 Sanyo Electric Co Ltd Speech speed changer
JPH09330094A (en) * 1996-06-10 1997-12-22 Takako Ito Voice reproducing device with variable tempo function
JPH10282991A (en) * 1997-04-02 1998-10-23 Matsushita Graphic Commun Syst Inc Speech rate converting device
JP2001255876A (en) * 2000-03-13 2001-09-21 Yamaha Corp Method for expanding and compressing musical sound waveform signal in time base direction
JP2001282297A (en) * 2000-03-29 2001-10-12 Pioneer Electronic Corp Method and device for reproducing sound information
JP2005535915A (en) * 2002-08-08 2005-11-24 コスモタン インク Time scale correction method of audio signal using variable length synthesis and correlation calculation reduction technique

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007304515A (en) * 2006-05-15 2007-11-22 Sony Corp Audio signal decompressing and compressing method and device
US8306828B2 (en) 2006-05-15 2012-11-06 Sony Corporation Method and apparatus for audio signal expansion and compression
JP2008058956A (en) * 2006-07-31 2008-03-13 Matsushita Electric Ind Co Ltd Speech reproduction device
US7894654B2 (en) 2008-07-08 2011-02-22 Ge Medical Systems Global Technology Company, Llc Voice data processing for converting voice data into voice playback data
JP2011007959A (en) * 2009-06-24 2011-01-13 Ge Medical Systems Global Technology Co Llc Speech data processing device, magnetic resonance imaging device, speech data processing method and program
US8484018B2 (en) 2009-08-21 2013-07-09 Casio Computer Co., Ltd Data converting apparatus and method that divides input data into plural frames and partially overlaps the divided frames to produce output data
CN113643728A (en) * 2021-08-12 2021-11-12 荣耀终端有限公司 Audio recording method, electronic device, medium, and program product
CN113643728B (en) * 2021-08-12 2023-08-22 荣耀终端有限公司 Audio recording method, electronic equipment, medium and program product

Also Published As

Publication number Publication date
JP4542805B2 (en) 2010-09-15

Similar Documents

Publication Publication Date Title
US9336823B2 (en) Playing audio in trick-modes
JP3925306B2 (en) Digital audio signal reproduction device
JP4236589B2 (en) Audio track playback method and apparatus for video trick mode playback
JP2005519538A (en) Silence period elimination by gate in video trick mode
JP4542805B2 (en) Variable speed reproduction method and apparatus, and program
JP4990375B2 (en) Recording / playback device
JP2005044409A (en) Information reproducing device, information reproducing method, and information reproducing program
JPH08287612A (en) Variable speed reproducing method for audio data
JP4739598B2 (en) Music data playback device
US7889969B2 (en) Audio frequency shifting during video trick modes
JP4107212B2 (en) Music playback device
JP2007179604A (en) Music player, reproduction control method, and program
JP2007257771A (en) Reproducing device, reproducing method, program, and recording medium
JP2000195234A (en) Reproducing device and method
JP5751421B2 (en) Audio playback device, audio playback method, and program
JP2007101772A (en) Reproducing device and reproducing method
JP2008145841A (en) Reproduction device, reproduction method, signal processing device and signal processing method
JP3559326B2 (en) Optical disc playback device
JP3812270B2 (en) Recording medium playback device
JP2004303409A (en) Digital voice signal reproduction system
JPH08287610A (en) Audio data reproducing device
JP4193240B2 (en) Compressed encoded data decoding apparatus and karaoke apparatus using the same
JP2005257832A (en) Musical performance reproducing device
WO2013035170A1 (en) Recording device, recording method and computer program for controlling recording
JP2006085843A (en) Recording apparatus and method

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070222

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100126

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100317

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100601

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100628

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130702

Year of fee payment: 3

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313115

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130702

Year of fee payment: 3

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees