JP2006146110A - Speech converting device - Google Patents
Speech converting device Download PDFInfo
- Publication number
- JP2006146110A JP2006146110A JP2004365023A JP2004365023A JP2006146110A JP 2006146110 A JP2006146110 A JP 2006146110A JP 2004365023 A JP2004365023 A JP 2004365023A JP 2004365023 A JP2004365023 A JP 2004365023A JP 2006146110 A JP2006146110 A JP 2006146110A
- Authority
- JP
- Japan
- Prior art keywords
- speech
- audio data
- digital audio
- digital
- speed
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Description
本発明は音程を変えずに音声の高速再生を行う、音声変換装置に関する。 The present invention relates to an audio conversion device that performs high-speed audio reproduction without changing the pitch.
従来、音程を変えずに音声の高速再生を行うには、音程が変わらない範囲でデジタル音声データを間引いて実現しているものもある(例えば、特許文献1参照。)。また、高性能のDSPを使用してフーリエ変換などを行うことで実現しているものもある。 Conventionally, in order to perform high-speed playback of sound without changing the pitch, there is also a method in which digital voice data is thinned out within a range where the pitch does not change (for example, see Patent Document 1). Some are realized by performing Fourier transform using a high-performance DSP.
前記従来の音程が変わらない範囲でデジタル音声データを間引く方法は、再生速度が上がるにつれて間引かれるデータの間隔が長くなり、再生した際の音声の劣化が激しくなってしまうという問題点を有していた。
また、前記従来のDSPを使用してフーリエ変換などを行う方法は、高性能のDSPや高速のメモリを必要とするため、装置が高価になってしまうという問題点を有していた。 In addition, the conventional method of performing Fourier transform using a DSP requires a high-performance DSP and a high-speed memory, so that the apparatus becomes expensive.
本発明は、このような従来の手法が有していた問題を解決しようとするものであり、高速再生時の音声の劣化を抑えながら、1チップマイコンを使用して音程を変えずに音声の高速再生を行うことことができる安価な音声変換装置を実現することを目的とする。 The present invention is intended to solve the problems of such a conventional method, and while suppressing deterioration of sound during high-speed playback, the sound can be reproduced without changing the pitch using a one-chip microcomputer. An object of the present invention is to realize an inexpensive audio conversion device that can perform high-speed reproduction.
本発明に係わる音声変換装置は、音声を入力するマイクと、音声を出力するジャックと、入力された音声をデジタル音声データに変換するADCと、デジタル音声データを音声に再変換するDACと、デジタル音声データを記録するメモリーカードと、プログラムを実行する1チップマイコンと、アルゴリズムを記憶したプログラムメモリと、動作状態を表示する表示部と、使用者が動作を選択する操作部で構成されている。 An audio conversion apparatus according to the present invention includes a microphone that inputs audio, a jack that outputs audio, an ADC that converts input audio into digital audio data, a DAC that reconverts digital audio data into audio, and a digital It consists of a memory card that records audio data, a one-chip microcomputer that executes a program, a program memory that stores an algorithm, a display unit that displays an operation state, and an operation unit that allows a user to select an operation.
以下、本発明の実施の形態を図1〜図3に基づいて説明する。 Hereinafter, embodiments of the present invention will be described with reference to FIGS.
図1は本発明の音声変換装置のブロック図である。マイクから入力された音声はADCによってアナログの音声信号からデジタル音声データに変換され、1チップマイコンに送られ、メモリーカードに記録される。 FIG. 1 is a block diagram of a speech conversion apparatus according to the present invention. The audio input from the microphone is converted from an analog audio signal to digital audio data by the ADC, sent to a one-chip microcomputer, and recorded on a memory card.
メモリーカードに記録されたデジタル音声データは、音声変換装置の使用者が操作部から指示を与えることで1チップマイコンによりメモリーカードから取り出され、プログラムメモリに書き込まれているアルゴリズムに従って速度変換の処理が行われてDACに送られ、DACによってデジタル音声データからアナログの音声信号に変換されてジャックより出力される。なお、表示部はこれらの動作状態の変移を表示する。 The digital audio data recorded on the memory card is taken out from the memory card by a one-chip microcomputer when the user of the audio conversion device gives an instruction from the operation unit, and the speed conversion process is performed according to the algorithm written in the program memory. After being sent to the DAC, the DAC converts the digital audio data into an analog audio signal and outputs it from the jack. The display unit displays changes in these operating states.
次に、図2と図3により2倍速での再生を例にとり、本発明の音声の高速再生のアルゴリズムを説明する。 Next, with reference to FIGS. 2 and 3, taking the reproduction at double speed as an example, the algorithm for high-speed reproduction of sound according to the present invention will be described.
図2−1は連続したデジタル音声データを、間引いても音程の変化が起こらない周期でブロック化した図であり、1ブロックには図2−2に示すように256ワードのデジタル音声データが含まれているものとする。 FIG. 2-1 is a diagram in which continuous digital audio data is blocked in a cycle in which the pitch does not change even if it is thinned out. One block includes 256 words of digital audio data as shown in FIG. It shall be assumed.
この1ブロックに含まれている256ワードのデジタル音声データを、図2−3に示すように1ワードを2回重ねて並べ替える。このときオーバーフローした129〜256番目のデジタル音声データは切り捨てる。 The 256-word digital audio data included in one block is rearranged by overlapping one word twice as shown in FIG. At this time, the overflowed 129th to 256th digital audio data are discarded.
図2−3の1ワードを2回重ねて並べ替えられたデジタル音声データを、録音時と同じサンプリング周波数で再生すると、再生速度は1倍速のままで1オクターブ音程の下がった音声が再生される。ここで再生時のサンプリング周波数を2倍に上げると音程が元の高さに戻り、再生速度が2倍になって、音程を変えずに2倍速での再生を実現することができる。 When the digital audio data that has been rearranged by overlapping one word in Fig. 2-3 is played back at the same sampling frequency as when recording, the playback speed remains at 1x speed, and the audio is lowered by one octave. . Here, when the sampling frequency at the time of reproduction is doubled, the pitch returns to the original pitch, the reproduction speed is doubled, and reproduction at double speed can be realized without changing the pitch.
図3は従来の音程が変わらない範囲でデジタル音声データを間引く方法と本発明のアルゴリズムを比較した図である。 FIG. 3 is a diagram comparing a conventional method of thinning out digital audio data within a range where the pitch does not change and the algorithm of the present invention.
従来の音程が変わらない範囲でデジタル音声データを間引く方法は、図3−1におけるTの周期で斜線の箇所の、偶数のデジタル音声データのブロックが間引かれる。 In the conventional method of thinning out digital audio data within a range in which the pitch does not change, even-numbered blocks of digital audio data are thinned out at hatched portions in the period T in FIG. 3-1.
図3−2は、図2−3で示した1ワードのデジタル音声データを2回重ねて並べ替えたデーターブロックであり、各データーブロックは129〜256番目のデジタル音声データが切り捨てられている。この切り捨てられた音声データーの周期はT/2になる。 FIG. 3B is a data block in which the 1-word digital audio data shown in FIG. 2C is overlapped and rearranged twice. In each data block, the 129th to 256th digital audio data are truncated. The period of the truncated audio data is T / 2.
図3−3は、図3−2のデジタル音声データのブロックを、サンプリング周波数を2倍にして2倍速で再生したときの図であり、再生速度が2倍になるため切り取られたデジタル音声データの周期はT/4となり、従来の音程が変わらない範囲でデジタル音声データを間引く方法と比べて1/4の周期でデジタル音声データを間引くことができ、再生時の音声の劣化を抑えて滑らかな音声の高速再生が可能となる。 FIG. 3C is a diagram when the block of the digital audio data in FIG. 3-2 is reproduced at double speed with the sampling frequency doubled, and the digital audio data cut out because the reproduction speed is doubled. The period is T / 4, and digital audio data can be thinned out with a period of 1/4 compared with the conventional method of thinning out digital audio data within the range where the pitch does not change, and smoothness is achieved by suppressing sound deterioration during playback. Sound can be played at high speed.
以上、2倍速での再生を例にとって説明したが、デジタル音声データの重ね合わせ方と再生時のサンプリング周波数の組み合わせで、様々な速度での音声の高速再生を行うことが可能となる。 As described above, the reproduction at the double speed has been described as an example. However, it is possible to perform high-speed audio reproduction at various speeds by combining digital audio data superimposition and the sampling frequency at the time of reproduction.
上述したように本発明の音声変換装置は、従来の音程が変わらない範囲でデジタル音声データを間引く方法と比べて1/4の周期でデジタル音声データを間引くことが可能なため、再生される音声の劣化を抑えて滑らかな音声の高速再生が可能となる。また、アルゴリズムがシンプルであるため高性能のDSPや高速のメモリを使用しなくても、安価な1チップマイコンを使用して音声変換装置を実現することが可能となる。 As described above, the audio conversion apparatus of the present invention can thin out digital audio data at a quarter cycle compared to the conventional method of thinning out digital audio data within a range where the pitch does not change. Smooth speech can be played at high speed while suppressing deterioration of the sound. In addition, since the algorithm is simple, it is possible to realize an audio conversion device using an inexpensive one-chip microcomputer without using a high-performance DSP or a high-speed memory.
Claims (2)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004365023A JP2006146110A (en) | 2004-11-19 | 2004-11-19 | Speech converting device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004365023A JP2006146110A (en) | 2004-11-19 | 2004-11-19 | Speech converting device |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2006146110A true JP2006146110A (en) | 2006-06-08 |
Family
ID=36625853
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004365023A Pending JP2006146110A (en) | 2004-11-19 | 2004-11-19 | Speech converting device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2006146110A (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113539294A (en) * | 2021-05-31 | 2021-10-22 | 河北工业大学 | Method for collecting and identifying sound of abnormal state of live pig |
-
2004
- 2004-11-19 JP JP2004365023A patent/JP2006146110A/en active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113539294A (en) * | 2021-05-31 | 2021-10-22 | 河北工业大学 | Method for collecting and identifying sound of abnormal state of live pig |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TW200304123A (en) | Audio frequency scaling during video trick modes utilizing digital signal processing | |
US9087503B2 (en) | Sampling device and sampling method | |
JP2006146110A (en) | Speech converting device | |
JP2005044409A (en) | Information reproducing device, information reproducing method, and information reproducing program | |
JP2009075280A (en) | Content playback device | |
JP2016065903A (en) | Musical sound control device, musical sound control method, program, and electronic musical instrument | |
JP4542805B2 (en) | Variable speed reproduction method and apparatus, and program | |
JP4191221B2 (en) | Recording / reproducing apparatus, simultaneous recording / reproducing control method, and simultaneous recording / reproducing control program | |
JP2007256896A (en) | Speech speed conversion device | |
JP6142488B2 (en) | Content playback apparatus, content playback method, and content playback program | |
JP2007257771A (en) | Reproducing device, reproducing method, program, and recording medium | |
KR100748370B1 (en) | Method and moving picture reproducing apparatus for synchronizing video and audio data | |
WO2016135990A1 (en) | Music playback application program | |
JP3875201B2 (en) | Data playback method | |
JP4610302B2 (en) | Recording / playback device | |
JP6149514B2 (en) | Digital signal processing apparatus with search function | |
JP2005284221A (en) | Speech converting device | |
JP2008145841A (en) | Reproduction device, reproduction method, signal processing device and signal processing method | |
JP2001318700A (en) | Speech speed converter | |
JP2012155822A (en) | Reproducer, reproduction method and computer program | |
JP2002073098A (en) | Voice reproducing device, voice preproducing method, image and voice reproducing device, and image and voice preproducing method | |
JP3975031B2 (en) | Reproducing apparatus and recording medium on which reproducing program is recorded | |
JP6181921B2 (en) | Voice reproduction apparatus, voice synthesis reproduction apparatus, and programs thereof | |
JP2017126347A (en) | Content reproduction device, content reproduction method, and content production program | |
JP2001312298A (en) | Device and method for speaking speed conversion processing, recording medium, and using method for speaking speed conversion processing device |