JP2007101644A - Voice reproducing apparatus - Google Patents

Voice reproducing apparatus Download PDF

Info

Publication number
JP2007101644A
JP2007101644A JP2005288312A JP2005288312A JP2007101644A JP 2007101644 A JP2007101644 A JP 2007101644A JP 2005288312 A JP2005288312 A JP 2005288312A JP 2005288312 A JP2005288312 A JP 2005288312A JP 2007101644 A JP2007101644 A JP 2007101644A
Authority
JP
Japan
Prior art keywords
data
audio data
voice
reproduction
audio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2005288312A
Other languages
Japanese (ja)
Other versions
JP4529859B2 (en
Inventor
Hiroyuki Takeishi
浩幸 武石
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Victor Company of Japan Ltd
Original Assignee
Victor Company of Japan Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Victor Company of Japan Ltd filed Critical Victor Company of Japan Ltd
Priority to JP2005288312A priority Critical patent/JP4529859B2/en
Publication of JP2007101644A publication Critical patent/JP2007101644A/en
Application granted granted Critical
Publication of JP4529859B2 publication Critical patent/JP4529859B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Signal Processing For Digital Recording And Reproducing (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To improve easiness of listening by suppressing voice degradation in minimum, when voice data is reproduced with a speed faster than original voice. <P>SOLUTION: A reproduction speed rate is set and a compression data is deleted in a packet unit in a data thinning section 33. The input compression data is decompressed to the voice data in a compression data decompressing section 35. It is determined whether the input voice data is sound or non-sound and the voice data of a non-sound period is deleted and the voice data of a sound period is output, in a non-voice period deleting section 37. A pitch cycle of the input voice data is extracted in a pitch extracting section. The voice data is thinned with a predetermined rate with a pitch cycle unit extracted by a thinning section 45 and the remaining voice data is synthesized in a synthesizing section 47 and output. Each section is controlled by a voice processing control section 31. <P>COPYRIGHT: (C)2007,JPO&INPIT

Description

本発明は、記録された音声情報を記録時間よりも短い再生時間で速く聞くことができる「早聞き」機能を備えた音声再生装置に関する。   The present invention relates to an audio reproducing apparatus having a “early listening” function capable of quickly listening to recorded audio information with a reproduction time shorter than the recording time.

会議などの音声やテレビ放送を録音・録画しておき、後で再生するように使われる装置が一般に知られている。また、このような装置に対して、通常の再生時間より短い時間で視聴したいという要望がある。   2. Description of the Related Art Generally, devices that are used to record and record audio such as conferences and TV broadcasts and play them later are known. In addition, there is a demand for such a device to view in a shorter time than the normal playback time.

従来、アナログ記録機器においてもこのような早聞き機能を実現している機器もあったが、モータの回転数を上げるだけでは再生時に音程が高くなったり、著しく音声品質が劣化するなどの問題があり、ユーザの要求を満足する品質にはほど遠かった。   In the past, some analog recording devices have realized such a fast listening function. However, simply increasing the number of rotations of the motor raises the pitch during playback and significantly degrades the sound quality. Yes, it was far from quality that met the user's requirements.

近年、HDD(ハードディスク装置)やDVDなどのデジタル記録機器においては、デジタル記録方式を採用しており、その利点として信号処理回路により音声品質が向上してきている。   In recent years, digital recording systems such as HDDs (Hard Disk Devices) and DVDs have adopted a digital recording system. As an advantage, the sound quality has been improved by signal processing circuits.

詳しくは、図6に示すように、デジタル記録機器は、アナログ波形の音声信号を信号処理回路によりデジタルデータに変換してLPCM(Liner Pulse Code Modulation)データを生成し、LPCMデータを圧縮してからHDDやDVDなどの記録媒体に記録する。ここで、記録媒体にデジタル記録されている音声データを、通常再生する速度の2倍速で高速再生するには以下のような方法が採用されている。   Specifically, as shown in FIG. 6, the digital recording device converts an analog waveform audio signal into digital data by a signal processing circuit to generate LPCM (Liner Pulse Code Modulation) data and compresses the LPCM data. Recording on a recording medium such as an HDD or a DVD. Here, the following method is employed for high speed reproduction of audio data digitally recorded on the recording medium at twice the normal reproduction speed.

(1)第1に、記録媒体にLPCM方式で記録された音声データを、2倍速の再生速度で再生する場合、図7に示すように、音声データを2倍速の再生速度で出力すると、処理が単純化されるという利点を有している。
(2)第2に、記録媒体にLPCM方式で記録された音声データを、1倍速の通常速度で再生する場合、図8に示すように、音声データを2つに1つの割合で間引いて出力すると、処理が単純化されるという利点を有している。
(3)第3に、圧縮された音声データを、1倍速の通常速度で再生する場合、図9に示すように、パケット化されたデータ列を2つに1つの割合で間引いて出力すると、音程が変わらない点や、処理が単純化されるという利点を有している。
特許第3081469号
(1) First, when audio data recorded on a recording medium by the LPCM method is reproduced at a reproduction speed of 2 × speed, as shown in FIG. 7, if the audio data is output at a reproduction speed of 2 × speed, processing is performed. Has the advantage of being simplified.
(2) Secondly, when the audio data recorded on the recording medium by the LPCM method is reproduced at a normal speed of 1 × speed, the audio data is thinned out at a ratio of one to two as shown in FIG. Then, there is an advantage that the processing is simplified.
(3) Thirdly, when the compressed audio data is reproduced at a normal speed of 1 × speed, as shown in FIG. 9, when the packetized data sequence is thinned out at a rate of one in two, and output, There is an advantage that the pitch does not change and the processing is simplified.
Japanese Patent No.3081469

しかしながら、上述した方法を採用した場合、
(1)第1の方法では、音程(ピッチ)が2倍になるという欠点があり、2倍速再生が可能なアナログ変換回路も構成上必要になるといった問題があった。
(2)第2の方法では、情報の欠落があるという欠点があった。
(3)第3の方法では、情報の一部に欠落があるという欠点があった。
However, when the method described above is adopted,
(1) The first method has a disadvantage that the pitch (pitch) is doubled, and there is a problem that an analog conversion circuit capable of double-speed reproduction is also required in the configuration.
(2) The second method has a drawback that information is missing.
(3) The third method has a drawback that some information is missing.

そこで、早き聞き再生している音声の劣化を最小限に抑えて聞き取り易さを向上することができる技術が切望されている。   Therefore, a technology that can improve the ease of listening by minimizing the deterioration of the voice that is being heard and played quickly is desired.

本発明は、上記に鑑みてなされたもので、その目的としては、音声データを原音声よりも早い速度で再生する場合に、音声の劣化を最小限に抑え、聞き取り易さを向上することができる音声再生装置を提供することにある。   The present invention has been made in view of the above. For the purpose of the present invention, when audio data is reproduced at a higher speed than the original audio, the deterioration of the audio is minimized, and the ease of listening is improved. An object of the present invention is to provide an audio playback device that can perform the above.

請求項1記載の発明は、上記課題を解決するため、入力される原音声データに対して再生速度が所定の再生倍率となるように、話速変換された音声データを生成する音声処理装置であって、前記再生倍率を設定する設定手段と、入力される圧縮データをパケット単位で削除する第1の間引き手段と、前記第1の間引き手段から出力される圧縮データを音声データに解凍する圧縮データ解凍手段と、前記圧縮データ解凍手段から出力される音声データに対して有音/無音の判断を行い無音区間の音声データを削除して有音区間の音声データを出力する無音区間削除手段と、前記無音区間削除手段から出力される音声データのピッチ周期を抽出するピッチ抽出手段と、前記ピッチ抽出手段により抽出されたピッチ周期の単位で音声データを所定の割合で間引きして残った音声データを出力する第2の間引き手段と、前記第2の間引き手段から出力される間引後に残った音声データを合成して出力する合成手段と、前記再生倍率が1〜1.5の範囲内で設定された場合に、前記無音区間削除手段が無音区間を少なくとも150msecだけ残して無音区間の削除するように制御し、かつ、前記第2の間引き手段が1/20の割合で間引いた後、残りの音声データと設定再生時間とを比較し、音声データの再生が設定再生時間以内で終了するように有音区間において更に話速変換処理によりデータを間引くように制御し、前記再生倍率が1.5〜2の範囲内で設定された場合に、前記無音区間削除手段が無音区間を少なくとも100msecだけ残して無音区間の削除するように制御し、かつ、前記第2の間引き手段が残りの音声データと設定再生時間とを比較し、音声データの再生が設定再生時間以内で終了するように有音区間において更に話速変換処理によりデータを間引くように制御し、前記再生倍率αが2より大きく設定された場合に、前記第1の間引き手段が(再生倍率−2)個に1の割合で圧縮データのパケットを削除するように制御し、前記無音区間削除手段が無音区間を削除するように制御し、かつ、第2の間引き手段が残りの音声データと設定再生データとを比較し、音声データの再生が設定再生時間以内で終了するように制御する制御手段を備えたことを要旨とする。   In order to solve the above-mentioned problem, the invention according to claim 1 is an audio processing device that generates audio data whose speech speed has been converted so that the reproduction speed becomes a predetermined reproduction magnification with respect to the input original audio data. The setting means for setting the reproduction magnification, the first decimation means for deleting the input compressed data in units of packets, and the compression for decompressing the compressed data output from the first decimation means to audio data Data decompression means, and silence interval deletion means for judging whether the voice data output from the compressed data decompression means is voiced / silent, deleting the voice data in the silent section, and outputting the voice data in the voiced section A pitch extracting means for extracting the pitch period of the voice data output from the silent section deleting means, and the voice data in a unit of the pitch period extracted by the pitch extracting means. A second decimation unit that outputs the audio data remaining after decimation, a synthesis unit that synthesizes and outputs the audio data remaining after decimation output from the second decimation unit, and the reproduction magnification is When set within the range of 1 to 1.5, the silent section deleting means controls the silent section to be deleted while leaving at least 150 msec of the silent section, and the second thinning means is 1 / After thinning out at a rate of 20, the remaining voice data is compared with the set playback time, and the voice data is further thinned out by the speech speed conversion process so that the playback of the voice data ends within the set playback time. And when the reproduction magnification is set within a range of 1.5 to 2, the silent section deleting means controls to delete the silent section leaving at least 100 msec of the silent section. The second thinning means compares the remaining audio data with the set reproduction time, and further thins out the data by the speech speed conversion process in the sound period so that the reproduction of the audio data is finished within the set reproduction time. And when the reproduction magnification α is set to be larger than 2, the first thinning means controls to delete the compressed data packet at a ratio of 1 to (reproduction magnification−2), and the silence The section deleting means controls to delete the silent section, and the second thinning means compares the remaining audio data with the set reproduction data, and controls so that the reproduction of the audio data ends within the set reproduction time. The gist of the present invention is that it includes a control means.

請求項1記載の本発明によれば、再生倍率が1〜1.5の範囲内で設定された場合に、無音区間を少なくとも150msecだけ残して無音区間の削除するように制御し、かつ、1/20の割合で間引いた後、残りの音声データと設定再生時間とを比較し、音声データの再生が設定再生時間以内で終了するように有音区間において更に話速変換処理によりデータを間引くように制御し、再生倍率が1.5〜2の範囲内で設定された場合に、無音区間を少なくとも100msecだけ残して無音区間の削除するように制御し、かつ、残りの音声データと設定再生時間とを比較し、音声データの再生が設定再生時間以内で終了するように有音区間において更に話速変換処理によりデータを間引くように制御し、再生倍率が2〜3の範囲内で設定された場合に、再生時間の2倍のデータ量になるようαケにつき(α−2)ケの割合で圧縮データを削除するように制御し、無音区間を削除するように制御し、かつ、残りの音声データと再生データとを比較し、音声データの再生が設定再生時間以内で終了するように制御することで、音声データを原音声よりも早い速度で再生する場合に、音声の劣化を最小限に抑え、聞き取り易さを向上することができる。   According to the first aspect of the present invention, when the reproduction magnification is set within a range of 1 to 1.5, the silent section is controlled to be deleted while leaving at least 150 msec, and 1 After thinning out at the rate of / 20, the remaining audio data is compared with the set playback time, and the data is further thinned out by the speech speed conversion process in the voiced section so that the playback of the audio data is completed within the set playback time. When the playback magnification is set within a range of 1.5 to 2, the silent section is controlled to be deleted while leaving at least 100 msec, and the remaining audio data and the set playback time are set. Are controlled so that the data is further thinned out by the speech speed conversion process in the sound period so that the reproduction of the audio data is finished within the set reproduction time, and the reproduction magnification is set within a range of 2 to 3. In such a case, control is performed so that the compressed data is deleted at a rate of (α−2) per α, so that the data amount is twice the playback time, and the silent section is deleted, and the remaining Audio data and playback data are compared and control is performed so that playback of the audio data ends within the set playback time, thereby minimizing audio degradation when playing back audio data at a speed faster than the original audio. It is possible to improve the ease of hearing by limiting to the limit.

以下、本発明の実施の形態を図面を参照して説明する。   Hereinafter, embodiments of the present invention will be described with reference to the drawings.

図1は、本発明の一実施の形態に係る音声処理装置に適用可能な映像・音声処理装置11の構成を示すブロック図である。なお、図1に示す映像・音声処理装置11はハードディスク(HDD)/DVDレコーダ装置の構成の一部を示している。   FIG. 1 is a block diagram showing a configuration of a video / audio processing apparatus 11 applicable to an audio processing apparatus according to an embodiment of the present invention. The video / audio processing device 11 shown in FIG. 1 shows a part of the configuration of a hard disk (HDD) / DVD recorder device.

A/Vエンコーダ部15は、外部入力端子19から入力される映像、及び音声データを圧縮し、圧縮されたトランスポートストリーム(TS)情報をA/Vデコーダ部17、又はストレージ部23へ出力する。   The A / V encoder unit 15 compresses video and audio data input from the external input terminal 19 and outputs the compressed transport stream (TS) information to the A / V decoder unit 17 or the storage unit 23. .

ストレージ部23は、デジタル系の映像、及び音声の圧縮データ保存可能なハードディスクドライブ(HDD)で構成されており、A/Vエンコーダ部15からの圧縮状態のトランスポートストリーム(TS)情報を一時保存し、またはA/Vデコーダ部17へ出力する。   The storage unit 23 includes a hard disk drive (HDD) capable of storing compressed digital video and audio data, and temporarily stores transport stream (TS) information in a compressed state from the A / V encoder unit 15. Or output to the A / V decoder unit 17.

A/Vデコーダ部17は、A/Vエンコード部15又はストレージ部23から入力した映像と音声とが重畳されたトランスポートストリーム(TS)情報からそれぞれ映像データと音声データを分離し、分離された圧縮状態の映像データと音声データを再生可能な映像データと音声データに伸張し、映像データは画像表示回路(図示しない)へ出力し、音声データは音声処理部31に出力する。   The A / V decoder unit 17 separates the video data and the audio data from the transport stream (TS) information in which the video and the audio input from the A / V encoding unit 15 or the storage unit 23 are superimposed. The compressed video data and audio data are expanded into reproducible video data and audio data, the video data is output to an image display circuit (not shown), and the audio data is output to the audio processing unit 31.

制御部27は、記憶されているプログラムを実行するマイクロプロセッサを有しており、図示しないリモコンやユーザ入力端子29や本体に設けられたキー等などを介してユーザ操作に応じた所望の機能内容を入力し、この所望の機能を実現するために各部に指令を出力して制御する。   The control unit 27 has a microprocessor that executes a stored program, and has a desired function content corresponding to a user operation via a remote controller (not shown), a user input terminal 29, a key provided on the main body, or the like. In order to realize this desired function, a command is output to each unit and controlled.

音声処理部31は、データ間引き部33、圧縮データ解凍部35、無音区間削除部37、メモリ部39、ピッチ抽出部43と間引き部45と合成部47とからなる話速変換部41、メモリ部49、D/A変換器51、音声処理制御部53とから構成されている。   The voice processing unit 31 includes a data thinning unit 33, a compressed data decompression unit 35, a silent section deletion unit 37, a memory unit 39, a speech extraction unit 41 including a pitch extraction unit 43, a thinning unit 45, and a synthesis unit 47, and a memory unit. 49, a D / A converter 51, and an audio processing control unit 53.

データ間引き部33は、圧縮データを削除して間引き処理を行い、間引く割合に応じて再生時間も短縮することができる。   The data thinning unit 33 can perform the thinning process by deleting the compressed data, and can shorten the reproduction time according to the thinning ratio.

圧縮データ解凍部35は、入力されるデータがAAC(Advanced Audio Coding )やAC3(Audio Code number 3 )など圧縮データの場合はLPCMデータへ解凍し、入力されるデータがLPCM方式の場合には解凍動作は行わずにそのままLPCMデータを出力する。   The compressed data decompressing unit 35 decompresses the input data to LPCM data if the input data is compressed data such as AAC (Advanced Audio Coding) or AC3 (Audio Code number 3), and decompresses if the input data is in the LPCM system. The LPCM data is output as it is without performing any operation.

無音区間削除部37は、入力される音声データに対して有音/無音などの判断を行い、無音もしくは不要な部分と判定された部分はその区間を削除し、有音区間の音声データをメモリ部39に記憶し、メモリ部39に記憶されている音声データを古い順に読み出す。メモリ部39は、無音区間削除部37から出力される残された有効な音声データを記録・保持する。   The silent section deletion unit 37 determines whether the input voice data is voiced / silent, deletes the section determined to be silent or unnecessary, and stores the voice data of the voiced section as a memory. The voice data stored in the unit 39 and stored in the memory unit 39 are read out in the oldest order. The memory unit 39 records and holds the remaining valid audio data output from the silent section deleting unit 37.

話速変換部41は、音声データのピッチ(基本周波数)の検出を行い、所望の話速を得るために、間引き処理、合成処理を行う。すなわち、ピッチ抽出部43は、音声データのピッチ周期(声帯振動の基本周期)を逐次抽出する。間引き部45は、抽出されたピッチ周期の単位で音声データを1/nの割合で間引き処理を行う。合成部47は、間引きされた音声区間の基本周期の単位で音声データを合成する合成処理などを実行する。メモリ部49は、間引き処理を行う間の音声データを記録・保持する。   The speech speed conversion unit 41 detects the pitch (fundamental frequency) of the voice data, and performs a thinning process and a synthesis process to obtain a desired speech speed. That is, the pitch extraction unit 43 sequentially extracts the pitch period (basic period of vocal cord vibration) of the audio data. The thinning unit 45 performs thinning processing on the audio data at a ratio of 1 / n in units of the extracted pitch period. The synthesizing unit 47 executes a synthesizing process for synthesizing audio data in units of basic periods of the thinned audio sections. The memory unit 49 records and holds audio data during the thinning process.

D/A変換器51は、話速変換部41から出力されるデジタル系の音声データをアナログ系の音声信号に変換する。   The D / A converter 51 converts the digital audio data output from the speech speed conversion unit 41 into an analog audio signal.

音声処理制御部53は、記憶されているプログラムを実行するマイクロプロセッサを有しており、図示しないリモコンやユーザ入力端子29や本体に設けられたキー等などを介してユーザ操作に応じた所望の機能内容を入力し、この所望の機能を実現するために各部に指令を出力して制御する。   The voice processing control unit 53 includes a microprocessor that executes a stored program, and performs a desired operation according to a user operation via a remote controller (not shown), a user input terminal 29, a key provided on the main body, or the like. The contents of the function are input, and in order to realize the desired function, a command is output to each unit and controlled.

次に、図3〜図5に示す各処理の概容を表す模式図を参照して、図2に示すフローチャートに従って映像・音声処理装置11の動作を説明する。なお、本フローチャートはプログラムとして音声処理制御部53に記憶されている。   Next, the operation of the video / audio processing apparatus 11 will be described with reference to the flowcharts shown in FIG. 2 with reference to schematic diagrams showing the outline of each process shown in FIGS. This flowchart is stored in the voice processing control unit 53 as a program.

まず、ステップS10では、音声処理制御部53は、制御部27を介して図示しないリモコンや操作パネルから入力される操作指令として、「早聞き」キーがONされたか否かを判断し、「早聞き」キーがONされるまでこの判断処理を繰り返す。   First, in step S10, the voice processing control unit 53 determines whether or not the “early listening” key is turned on as an operation command input from a remote controller or an operation panel (not shown) via the control unit 27. This determination process is repeated until the “listen” key is turned on.

「早聞き」キーがONされた場合、ステップS20に進み、音声処理制御部53は、制御部27を介して図示しないリモコンや操作パネルから入力される再生倍率αを音声処理制御部53の内部メモリに一旦記憶し、ステップS30に進む。なお、再生倍率αの入力がない場合には前回入力されたときの保存値を再生倍率αとして再度使用してもよい。   When the “early listening” key is turned on, the process proceeds to step S20, where the audio processing control unit 53 sets the reproduction magnification α input from the remote controller or the operation panel (not shown) via the control unit 27 in the audio processing control unit 53. Once stored in the memory, the process proceeds to step S30. If there is no input of the reproduction magnification α, the stored value when it was previously input may be used again as the reproduction magnification α.

次いで、ステップS30では、音声処理制御部53は、制御部27を介してA/Vデコーダ部17から出力される情報に音声データがLPCM方式のフォーマットを有していることを表す記録状態情報があるか否かを判断し、音声データがLPCM方式の場合にはメモリ部39に音声データを記憶しステップS70に進む一方、音声データがLPCM方式ではない場合にはステップS40に進む。   Next, in step S30, the audio processing control unit 53 includes recording state information indicating that the audio data has the LPCM format in the information output from the A / V decoder unit 17 via the control unit 27. If the audio data is LPCM, the audio data is stored in the memory unit 39 and the process proceeds to step S70. If the audio data is not LPCM, the process proceeds to step S40.

ここで、ステップS40では、音声処理制御部53は現在内部メモリに設定されている再生倍率αがα≦2かどうかを判断する。   Here, in step S40, the audio processing control unit 53 determines whether or not the reproduction magnification α currently set in the internal memory is α ≦ 2.

再生倍率αがα>2(NOの場合)となる場合には、ステップS50に進み、音声処理制御部53はデータ間引き部33を制御し、入力されるパケットデータ単位でデータ量が再生時間の2倍になるようにαケにつき(α−2)ケの割合でパケットデータを削除させ、ステップS60に進む。   When the reproduction magnification α is α> 2 (in the case of NO), the process proceeds to step S50, where the audio processing control unit 53 controls the data thinning unit 33, and the amount of data is the reproduction time in units of input packet data. The packet data is deleted at a rate of (α-2) per α so as to be doubled, and the process proceeds to step S60.

一方、再生倍率αがα≦2(YESの場合)となる場合には、ステップS60に進み、音声処理制御部53は圧縮データ解凍部35を制御し、入力されるデータがAACやAC3など圧縮データの場合にはLPCMデータへ解凍させ、メモリ部39に音声データを記憶する。   On the other hand, when the reproduction magnification α is α ≦ 2 (in the case of YES), the process proceeds to step S60, where the audio processing control unit 53 controls the compressed data decompressing unit 35, and the input data is compressed such as AAC or AC3. In the case of data, it is decompressed into LPCM data, and the audio data is stored in the memory unit 39.

次いで、ステップS70では、音声処理制御部53は無音区間削除部37を制御し、無音区間削除部37に入力される音声データが有音か無音かを判定し、無音区間がある場合には、無音区間のデータ番号を付加した無音番号ラベルを出力する。例えば、図3に示すように、入力されるデジタルデータの中で13〜20番までのデータが無音区間となる。   Next, in step S70, the voice processing control unit 53 controls the silent section deleting unit 37 to determine whether the voice data input to the silent section deleting unit 37 is voiced or silent. Output a silent number label with the data number of the silent section added. For example, as shown in FIG. 3, among input digital data, data Nos. 13 to 20 are silent sections.

次いで、ステップS80では、音声処理制御部53は設定された再生倍率αが以下のように分割された範囲のどこにあるかを比較する。   Next, in step S80, the sound processing control unit 53 compares where the set reproduction magnification α is in the divided range as follows.

(1<α≦1.5の場合)
ここで、図4に示す模式図を参照して、再生倍率αが1<α≦1.5の場合の処理について説明する。なお、記録されている音声データの通常の再生時間が60分とし、このうち40分までの視聴時間を想定して以下の処理を行うこととする。
(When 1 <α ≦ 1.5)
Here, with reference to the schematic diagram shown in FIG. 4, processing when the reproduction magnification α is 1 <α ≦ 1.5 will be described. Note that the normal playback time of recorded audio data is 60 minutes, and the following processing is performed assuming a viewing time of 40 minutes.

ステップS80において、音声処理制御部53は設定された再生倍率αの範囲が、1<α≦1.5が成立する場合には、ステップS90に進む。   In step S80, if the range of the set reproduction magnification α satisfies 1 <α ≦ 1.5, the audio processing control unit 53 proceeds to step S90.

次いで、ステップS90では、無音区間削除部37は、メモリ部39に記憶されたLPCMデータに対して、文間休止部分として少なくとも150msecの無音区間を残し、他の余分な無音区間として無音番号ラベル(13〜20番)が付加されたLPCMデータを削除し、話速変換部41に出力する。   Next, in step S90, the silent section deleting unit 37 leaves a silent section of at least 150 msec as a pause between sentences for the LPCM data stored in the memory unit 39, and a silent number label ( LPCM data to which No. 13 to No. 20) is added is deleted and output to the speech speed conversion unit 41.

なお、文間休止部分とは、一定時間以上の無音区間のことをいい、発話の間の息継ぎや"ま"などがこれに相当する。また、一般的なテレビ放送では音声データの20〜30%が無音区間であり、会議などでは音声データの50%程度が無音区間となる。   The inter-sentence pause part refers to a silent period of a certain time or longer, and corresponds to breathing or “ma” between utterances. In general television broadcasting, 20 to 30% of audio data is a silent section, and in a conference or the like, about 50% of audio data is a silent section.

次いで、ステップS130では、制御部27は音声処理制御部53を介して話速変換部41に対して、有音区間の伸張率βを0.95と設定する。次いで、ステップS140では、音声データ(0〜32番のうち1番と29番および13〜20番が削除された音声データ)と再生時間(40分)とを比較し、再生時間に適するように有音区間において話速変換処理によりデータを間引き、再生時間を短縮する。   Next, in step S130, the control unit 27 sets the expansion rate β of the voiced section to 0.95 for the speech speed conversion unit 41 via the voice processing control unit 53. Next, in step S140, the audio data (the audio data from which No. 1, No. 29 and No. 13 to No. 20 of No. 0 to No. 32 are deleted) is compared with the reproduction time (40 minutes), so as to be suitable for the reproduction time. Data is thinned out by speech speed conversion processing in a voiced section to shorten the playback time.

すなわち、無音区間削除部37から出力された音声データは話速変換部41に設けられたメモリ部49に記憶される。次いで、ピッチ抽出部43では、メモリ部49に記憶されている音声データのピッチ周期を逐次抽出し、間引き部45では、抽出されたピッチ周期の単位で音声データを1/20の割合で間引き処理を行う。この結果、図4に示すようにデータ(1,29番)が間引かれ、間引かれていない音声データが合成部47に設けられた図示しない出力バッファに出力される。さらに、合成部47では出力バッファから読み出した音声データを音声区間の基本周期の単位で合成してD/A変換器51に出力する。D/A変換器51では、図4に示す再生波形のように、話速変換部41から出力されるデジタル系の音声データをアナログ系の音声信号に変換する。   That is, the voice data output from the silent section deletion unit 37 is stored in the memory unit 49 provided in the speech speed conversion unit 41. Next, the pitch extraction unit 43 sequentially extracts the pitch period of the audio data stored in the memory unit 49, and the decimation unit 45 decimates the audio data at a ratio of 1/20 in units of the extracted pitch period. I do. As a result, as shown in FIG. 4, data (No. 1, 29) is thinned out, and audio data that has not been thinned is output to an output buffer (not shown) provided in the synthesis unit 47. Further, the synthesizing unit 47 synthesizes the audio data read from the output buffer in units of the basic period of the audio section and outputs the synthesized data to the D / A converter 51. The D / A converter 51 converts the digital audio data output from the speech speed conversion unit 41 into an analog audio signal as in the reproduction waveform shown in FIG.

なお、伸張率βとは、実際に記録されている原音声データに対して話速変換処理を用いて時間軸上でのデータの短縮・伸張を行うときの原音声データと処理後の音声データとの比率をいう。この例で示す伸張率βが0.95とは、1/20の割合で音声データを間引き、時間短縮することを意味する。一般に、伸張率βが0.95〜1.05では、人は音声の発話速度の変化に気が付かない。   Note that the expansion rate β is the original voice data and the processed voice data when the original voice data actually recorded is shortened / expanded on the time axis using the speech speed conversion process. The ratio. In this example, the expansion rate β of 0.95 means that the audio data is thinned out at a rate of 1/20 and the time is shortened. In general, when the expansion rate β is 0.95 to 1.05, a person is unaware of changes in the speech rate of speech.

次いで、ステップS150では、音声処理制御部53は制御部27を介して図示しないリモコンや操作パネルから入力される操作指令として、「停止」キーがONされたか否かを判断し、「停止」キーがONされていない場合には、ステップS30に戻りステップS30〜S150の処理を繰り返す。一方、「停止」キーがONされた場合には、処理を終了する。   Next, in step S150, the voice processing control unit 53 determines whether or not the “stop” key is turned on as an operation command input from a remote controller or an operation panel (not shown) via the control unit 27, and the “stop” key. If is not ON, the process returns to step S30 and the processes of steps S30 to S150 are repeated. On the other hand, if the “stop” key is turned on, the process is terminated.

このように、再生倍率αが1<α≦1.5の範囲内にある場合、図4に示すように、音声処理以前の原音声データと比べて伸張率βが0.95であるので、音声区間の発話速度の変化はほとんどなく、有音区間では標準再生時に近い聴取が可能となる。特に、従来の技術では音声内容は理解できるが、早口になり聞き取り辛いのに対して、本実施の形態によれば、非常に聞き取り易いという利点を有している。   Thus, when the reproduction magnification α is in the range of 1 <α ≦ 1.5, as shown in FIG. 4, the expansion rate β is 0.95 compared to the original audio data before audio processing. There is almost no change in the speech rate in the voice section, and in the voiced section, listening close to the normal playback becomes possible. In particular, although the voice content can be understood by the conventional technology, it is difficult to hear the speech quickly, but according to the present embodiment, there is an advantage that it is very easy to hear.

(1.5<α≦2の場合)
また、ステップS80において、音声処理制御部53は設定された再生倍率αの範囲が、1.5<α≦2が成立する場合には、ステップS100に進む。なお、記録されている音声データの通常の再生時間が60分とし、このうち30分までの視聴時間を想定して以下の処理を行うこととする。
(If 1.5 <α ≦ 2)
In step S80, if the set range of the reproduction magnification α satisfies 1.5 <α ≦ 2, the audio processing control unit 53 proceeds to step S100. The normal playback time of recorded audio data is 60 minutes, and the following processing is performed assuming a viewing time of up to 30 minutes.

次いで、ステップS100では、無音区間削除部37は、メモリ部39に記憶されたLPCMデータに対して、文間休止部分として少なくとも100msecの無音区間を残し、他の余分な無音区間として無音番号ラベル(13〜20番)が付加されたLPCMデータを削除し、話速変換部41に出力する。   Next, in step S100, the silent section deleting unit 37 leaves a silent section of at least 100 msec as a pause between sentences for the LPCM data stored in the memory unit 39, and a silent number label ( LPCM data to which No. 13 to No. 20) is added is deleted and output to the speech speed conversion unit 41.

すなわち、無音区間削除部37から出力された音声データは話速変換部41に設けられたメモリ部49に記憶される。次いで、ピッチ抽出部43では、メモリ部49に記憶されている音声データのピッチ周期を逐次抽出し、間引き部45では、音声データと設定再生時間を比較し、音声データの再生が設定再生時間以内で終了するように有音区間において話速変換処理によりデータを間引き、再生時間を短縮する。この結果、データが間引かれ、間引かれていない音声データが合成部47に設けられた図示しない出力バッファに出力される。さらに、合成部47では出力バッファから読み出した音声データを音声区間の基本周期の単位で合成してD/A変換器51に出力する。D/A変換器51では、話速変換部41から出力されるデジタル系の音声データをアナログ系の音声信号に変換する。   That is, the voice data output from the silent section deletion unit 37 is stored in the memory unit 49 provided in the speech speed conversion unit 41. Next, the pitch extraction unit 43 sequentially extracts the pitch period of the audio data stored in the memory unit 49, and the thinning unit 45 compares the audio data with the set reproduction time, and the reproduction of the audio data is within the set reproduction time. The data is thinned out by the speech speed conversion process in the voiced section so that the reproduction time is shortened. As a result, the data is thinned out and the sound data not thinned out is output to an output buffer (not shown) provided in the synthesis unit 47. Further, the synthesizing unit 47 synthesizes the audio data read from the output buffer in units of the basic period of the audio section and outputs the synthesized data to the D / A converter 51. The D / A converter 51 converts the digital audio data output from the speech speed conversion unit 41 into an analog audio signal.

このように、再生倍率αが1.5<α≦2の範囲内にある場合、音声処理以前の原音声と比べて早口のような音声になるが、聞き取りに耐えうる品質を保っている。特に、従来の技術では音声ガイドとして補助的な役割に留まり、早聞きには適さないのに対して、本実施の形態によれば、早聞きに適しているという利点を有している。   In this way, when the reproduction magnification α is in the range of 1.5 <α ≦ 2, the sound is more swift than the original sound before the sound processing, but the quality that can withstand listening is maintained. In particular, the conventional technique only has an auxiliary role as a voice guide and is not suitable for fast listening, whereas the present embodiment has an advantage that it is suitable for fast listening.

(2<αの場合)
図5に示す模式図を参照して、再生倍率αが2<αの場合の処理について説明する。なお、図5では、再生倍率α=3について示している。
(If 2 <α)
With reference to the schematic diagram shown in FIG. 5, processing when the reproduction magnification α is 2 <α will be described. FIG. 5 shows the reproduction magnification α = 3.

ステップS50では、音声処理制御部53は例えば記録データが圧縮された音源データの場合は、図5に示すように、データ間引き部33でパケットに対して3ヶにつき (3−2)ヶ、すなわち、1/3の割合となる一定間隔でパケットの間引きを行う。この結果、データ間引き部33からパケット(0−2),(0−5)が間引かれたパケットが圧縮データ解凍部35に入力される。   In step S50, for example, when the recording data is compressed sound source data, the audio processing control unit 53 uses (3-2) packets for every 3 packets in the data thinning unit 33 as shown in FIG. , Packets are thinned out at a constant interval of 1/3. As a result, the packet in which the packets (0-2) and (0-5) are thinned out from the data thinning unit 33 is input to the compressed data decompressing unit 35.

ステップS80において、音声処理制御部53は設定された再生倍率αの範囲が、2<αが成立する場合には、ステップS110に進む。   In step S80, if the range of the set reproduction magnification α satisfies 2 <α, the audio processing control unit 53 proceeds to step S110.

次いで、ステップS110では、無音区間削除部37は、メモリ部39に記憶されたLPCMデータに対して、無音区間として無音番号ラベル(15〜20番)が付加されたLPCMデータを削除し、話速変換部41に出力する。   Next, in step S110, the silent section deleting unit 37 deletes the LPCM data to which the silent number label (numbers 15 to 20) is added as a silent section from the LPCM data stored in the memory unit 39, and the speech speed. The data is output to the conversion unit 41.

次いで、ステップS140では、音声データ(0〜34番のうち10〜20番および25〜29番が削除された音声データ)と設定再生時間(20分)とを比較し、音声データの再生が設定再生時間以内で終了するように有音区間において話速変換処理によりデータを間引き、再生時間を短縮する。   Next, in step S140, the audio data (audio data in which numbers 10 to 20 and numbers 25 to 29 are deleted from the numbers 0 to 34) are compared with the set reproduction time (20 minutes), and reproduction of the audio data is set. Data is thinned out by speech speed conversion processing in a voiced section so as to end within the playback time, and the playback time is shortened.

すなわち、無音区間削除部37から出力された音声データは話速変換部41に設けられたメモリ部49に記憶される。次いで、ピッチ抽出部43では、メモリ部49に記憶されている音声データのピッチ周期を逐次抽出し、間引き部45では、音声データと設定再生時間を比較し、音声データの再生が設定再生時間以内で終了するように有音区間において話速変換処理によりデータを間引き、再生時間を短縮する。この結果、図5に示すようにデータ(2,6,9,23,31番)が間引かれ、間引かれていない音声データが合成部47に設けられた図示しない出力バッファに出力される。さらに、合成部47では出力バッファから読み出した音声データを音声区間の基本周期の単位で合成してD/A変換器51に出力する。D/A変換器51では、図5に示す再生波形のように、話速変換部41から出力されるデジタル系の音声データをアナログ系の音声信号に変換する。   That is, the voice data output from the silent section deletion unit 37 is stored in the memory unit 49 provided in the speech speed conversion unit 41. Next, the pitch extraction unit 43 sequentially extracts the pitch period of the audio data stored in the memory unit 49, and the thinning unit 45 compares the audio data with the set reproduction time, and the reproduction of the audio data is within the set reproduction time. The data is thinned out by the speech speed conversion process in the voiced section so that the reproduction time is shortened. As a result, as shown in FIG. 5, the data (Nos. 2, 6, 9, 23, and 31) are thinned, and the audio data that has not been thinned is output to an output buffer (not shown) provided in the synthesis unit 47. . Further, the synthesizing unit 47 synthesizes the audio data read from the output buffer in units of the basic period of the audio section and outputs the synthesized data to the D / A converter 51. The D / A converter 51 converts the digital audio data output from the speech speed conversion unit 41 into an analog audio signal as in the reproduction waveform shown in FIG.

このように、再生倍率αが2より大きい場合、2<α≦3の範囲内にある場合、図5に示すように、音声処理以前の原音声と比べて早口で情報の欠落も生じるが、内容は理解できる。特に、従来の技術では聞き取ることが困難であったのに対して、本実施の形態によれば、聞き取り可能であり困難さを与えないという利点を有している。   In this way, when the reproduction magnification α is larger than 2, when 2 <α ≦ 3, as shown in FIG. 5, information is lost early compared to the original sound before sound processing. I understand the contents. In particular, it is difficult to hear with the conventional technique, but according to this embodiment, there is an advantage that it is audible and does not give any difficulty.

また、再生倍率αが3<α≦4の範囲内にある場合、音声処理以前の原音声と比べて早口で情報の欠落も生じるが、音声ガイドとして補助機能となる。特に、従来の技術では聞き取り不可能であったのに対して、本実施の形態によれば、聞き取り可能であるという利点を有している。   Further, when the reproduction magnification α is in the range of 3 <α ≦ 4, information is lost more quickly than the original sound before the sound processing, but it is an auxiliary function as a sound guide. In particular, the present embodiment has an advantage that it is audible, whereas it cannot be heard by the conventional technique.

さらに、4<αでは、音声が著しく劣化するが、音声ガイドとして役立つ可能性がある。特に、従来の技術では聞き取り不可能なうえノイズとして聞こえ煩わしいものであったのに対し、本実施の形態によれば、製品や機種の用途によりその目的を果たすという利点を有している。   Furthermore, when 4 <α, the voice is significantly deteriorated, but it may be useful as a voice guide. In particular, while the conventional technique cannot be heard and is troublesome to hear as noise, the present embodiment has the advantage of fulfilling its purpose depending on the use of the product or model.

以上のように、発話速度を時間軸上で変更する「話速変換技術」と、「データの間引き」を併用し、かつ、再生倍率αにより各々の処理パラメータを変更することにより、音声の聞き取り易さを向上することができる。   As described above, by using “speech speed conversion technology” that changes the speech speed on the time axis and “data thinning” in combination, and by changing each processing parameter according to the playback magnification α, it is possible to listen to the voice. Easiness can be improved.

本発明の一実施の形態に係る音声処理装置に適用可能な映像・音声処理装置11の構成を示すブロック図である。It is a block diagram which shows the structure of the video / audio processing apparatus 11 applicable to the audio processing apparatus which concerns on one embodiment of this invention. 映像・音声処理装置11の動作を説明するためのフローチャートである。3 is a flowchart for explaining the operation of the video / audio processing apparatus 11; 無音区間がある音声波形とその音声データとを示す模式図である。It is a schematic diagram which shows the audio | voice waveform with a silence area, and its audio | voice data. 再生倍率αが1<α≦1.5の場合の音声データと再生波形の模式図である。FIG. 6 is a schematic diagram of audio data and a reproduction waveform when a reproduction magnification α is 1 <α ≦ 1.5. 再生倍率αが2<α≦3の場合の音声データと再生波形の模式図である。It is a schematic diagram of audio data and a reproduction waveform when a reproduction magnification α is 2 <α ≦ 3. 音声波形と音声データとの模式図である。It is a schematic diagram of a speech waveform and speech data. LPCMデータを2倍速再生したときの音声データと再生波形の模式図である。It is a schematic diagram of audio data and reproduction waveform when LPCM data is reproduced at double speed. LPCMデータを1/2間引いてから1倍速再生したときの音声データと再生波形の模式図である。It is a schematic diagram of audio data and a reproduction waveform when LPCM data is thinned by half and then reproduced at 1 × speed. 圧縮された音声データをパケット単位で1/2間引いてから1倍速再生したときの音声データと再生波形の模式図である。FIG. 4 is a schematic diagram of audio data and a reproduction waveform when compressed audio data is thinned out by 1/2 in packet units and then reproduced at 1 × speed.

符号の説明Explanation of symbols

11 映像・音声処理装置
15 A/Vエンコーダ部
17 A/Vデコーダ部
23 ストレージ部
27 制御部
31 音声処理回路
33 データ間引き部
35 圧縮データ解凍部
37 無音区間削除部
39 メモリ部
41 話速変換部
43 ピッチ抽出部
45 間引き部
47 合成部
49 メモリ部
51 D/A変換器
53 音声処理制御部(制御手段)
DESCRIPTION OF SYMBOLS 11 Image | video audio | voice processing apparatus 15 A / V encoder part 17 A / V decoder part 23 Storage part 27 Control part 31 Voice processing circuit 33 Data thinning part 35 Compressed data decompression part 37 Silent section deletion part 39 Memory part 41 Speech speed conversion part 43 Pitch extraction unit 45 Thinning-out unit 47 Synthesis unit 49 Memory unit 51 D / A converter 53 Audio processing control unit (control means)

Claims (1)

入力される原音声データに対して再生速度が所定の再生倍率となるように、話速変換された音声データを生成する音声処理装置であって、
前記再生倍率を設定する設定手段と、
入力される圧縮データをパケット単位で削除する第1の間引き手段と、
前記第1の間引き手段から出力される圧縮データを音声データに解凍する圧縮データ解凍手段と、
前記圧縮データ解凍手段から出力される音声データに対して有音/無音の判断を行い無音区間の音声データを削除して有音区間の音声データを出力する無音区間削除手段と、
前記無音区間削除手段から出力される音声データのピッチ周期を抽出するピッチ抽出手段と、
前記ピッチ抽出手段により抽出されたピッチ周期の単位で音声データを所定の割合で間引きして残った音声データを出力する第2の間引き手段と、
前記第2の間引き手段から出力される間引後に残った音声データを合成して出力する合成手段と、
前記再生倍率が1〜1.5の範囲内で設定された場合に、前記無音区間削除手段が無音区間を少なくとも150msecだけ残して無音区間の削除するように制御し、かつ、前記第2の間引き手段が1/20の割合で間引いた後、残りの音声データと設定再生時間とを比較し、音声データの再生が設定再生時間以内で終了するように有音区間において更に話速変換処理によりデータを間引くように制御し、
前記再生倍率が1.5〜2の範囲内で設定された場合に、前記無音区間削除手段が無音区間を少なくとも100msecだけ残して無音区間の削除するように制御し、かつ、前記第2の間引き手段が残りの音声データと設定再生時間とを比較し、音声データの再生が設定再生時間以内で終了するように有音区間において
更に話速変換処理によりデータを間引くように制御し、
再生倍率が2より大きい範囲で設定された場合に、前記第1の間引き手段が(再生倍率−2)個に1の割合で圧縮データのパケットを削除するように制御し、前記無音区間削除手段が無音区間を削除するように制御し、
かつ、第2の間引き手段が残りの音声データと設定再生時間とを比較し、音声データの再生が設定再生時間以内で終了するように有音区間において更に話速変換処理によりデータを一定周期かつ均等に間引くように制御する制御手段を備えたことを特徴とする音声処理装置。


A speech processing device that generates speech data whose speech speed has been converted so that a playback speed is a predetermined playback magnification with respect to input original speech data,
Setting means for setting the reproduction magnification;
A first thinning means for deleting input compressed data in units of packets;
Compressed data decompression means for decompressing the compressed data output from the first thinning means into audio data;
A silent section deleting means for determining whether the voice data output from the compressed data decompressing means is voiced / silent, deleting the voice data of the silent section and outputting the voice data of the voiced section;
Pitch extraction means for extracting the pitch period of the audio data output from the silent section deletion means;
A second decimation unit that outputs the remaining audio data after decimation of the audio data at a predetermined rate in units of the pitch period extracted by the pitch extraction unit;
Synthesizing means for synthesizing and outputting the audio data remaining after decimation output from the second decimation means;
When the reproduction magnification is set within a range of 1 to 1.5, the silent section deleting means controls to delete the silent section leaving at least 150 msec of the silent section, and the second thinning-out. After the means thins out at a rate of 1/20, the remaining voice data is compared with the set playback time, and the voice data is further converted by the speech speed conversion process in the voiced section so that the playback of the voice data ends within the set playback time Control to thin out
When the reproduction magnification is set within a range of 1.5 to 2, the silence interval deletion means controls to delete the silence interval while leaving the silence interval at least 100 msec, and the second decimation is performed. The means compares the remaining audio data with the set playback time, so that the audio data playback ends within the set playback time.
Furthermore, it controls to thin out the data by the speech speed conversion process
When the reproduction magnification is set in a range larger than 2, the first decimation means controls to delete the compressed data packet at a ratio of 1 to (reproduction magnification -2), and the silent section deletion means Control to delete the silent section,
In addition, the second thinning means compares the remaining audio data with the set reproduction time, and in the sound period, the data is further converted into a fixed period and in a sound period so that the reproduction of the audio data is finished within the set reproduction time. An audio processing apparatus comprising control means for performing control so as to be thinned out evenly.


JP2005288312A 2005-09-30 2005-09-30 Audio playback device Active JP4529859B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005288312A JP4529859B2 (en) 2005-09-30 2005-09-30 Audio playback device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005288312A JP4529859B2 (en) 2005-09-30 2005-09-30 Audio playback device

Publications (2)

Publication Number Publication Date
JP2007101644A true JP2007101644A (en) 2007-04-19
JP4529859B2 JP4529859B2 (en) 2010-08-25

Family

ID=38028672

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005288312A Active JP4529859B2 (en) 2005-09-30 2005-09-30 Audio playback device

Country Status (1)

Country Link
JP (1) JP4529859B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009075177A (en) * 2007-09-19 2009-04-09 Sony Corp Information processing apparatus, information processing method and program

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06332500A (en) * 1993-05-21 1994-12-02 Olympus Optical Co Ltd Voice reproducing device with variable speed reproducing function
JP2002258900A (en) * 2001-02-28 2002-09-11 Toshiba Corp Device and method for reproducing voice

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06332500A (en) * 1993-05-21 1994-12-02 Olympus Optical Co Ltd Voice reproducing device with variable speed reproducing function
JP2002258900A (en) * 2001-02-28 2002-09-11 Toshiba Corp Device and method for reproducing voice

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009075177A (en) * 2007-09-19 2009-04-09 Sony Corp Information processing apparatus, information processing method and program
US8457322B2 (en) 2007-09-19 2013-06-04 Sony Corporation Information processing apparatus, information processing method, and program

Also Published As

Publication number Publication date
JP4529859B2 (en) 2010-08-25

Similar Documents

Publication Publication Date Title
JP4319548B2 (en) Audio program playback method and apparatus during video trick mode playback
JP4895418B2 (en) Audio reproduction method and audio reproduction apparatus
EP1483908B1 (en) Audio frequency scaling during video trick modes utilizing digital signal processing
JP3630609B2 (en) Audio information reproducing method and apparatus
JP2010283605A (en) Video processing device and method
JP4529859B2 (en) Audio playback device
US20010029456A1 (en) Play back apparatus
JP2009075280A (en) Content playback device
JP2007183410A (en) Information reproduction apparatus and method
JP3081469B2 (en) Speech speed converter
JP2006243128A (en) Reproducing device and reproducing method
US20060093157A1 (en) Audio high-speed reproducing device and audio high-speed reproducing method
JP2001222300A (en) Voice reproducing device and recording medium
JPH0854895A (en) Reproducing device
JPH08292790A (en) Video tape recorder
JP4665550B2 (en) Playback apparatus and playback method
JP4229041B2 (en) Signal reproducing apparatus and method
JP2001318700A (en) Speech speed converter
JP2004206771A (en) Simple reproducing method, simple reproducing device usable for the same, decoding method, and decoding device
KR20010085664A (en) Speech speed converting device
JP4164613B2 (en) Signal reproduction method and signal reproduction apparatus
JP2004303409A (en) Digital voice signal reproduction system
JP2005204003A (en) Continuous media data fast reproduction method, composite media data fast reproduction method, multichannel continuous media data fast reproduction method, video data fast reproduction method, continuous media data fast reproducing device, composite media data fast reproducing device, multichannel continuous media data fast reproducing device, video data fast reproducing device, program, and recording medium
JPH08137500A (en) Recording and reproducing method for sound or picture signal and device therefor
JPH08287610A (en) Audio data reproducing device

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20071228

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100518

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100531

R151 Written notification of patent or utility model registration

Ref document number: 4529859

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130618

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130618

Year of fee payment: 3

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130618

Year of fee payment: 3

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350