JPH01267700A - Speech processor - Google Patents
Speech processorInfo
- Publication number
- JPH01267700A JPH01267700A JP63095693A JP9569388A JPH01267700A JP H01267700 A JPH01267700 A JP H01267700A JP 63095693 A JP63095693 A JP 63095693A JP 9569388 A JP9569388 A JP 9569388A JP H01267700 A JPH01267700 A JP H01267700A
- Authority
- JP
- Japan
- Prior art keywords
- output
- filter
- clock signal
- pitch
- spectrum analyzer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001228 spectrum Methods 0.000 claims abstract description 14
- 230000015572 biosynthetic process Effects 0.000 claims description 14
- 238000003786 synthesis reaction Methods 0.000 claims description 14
- 230000005236 sound signal Effects 0.000 claims description 4
- 230000002194 synthesizing effect Effects 0.000 abstract 4
- 239000002131 composite material Substances 0.000 abstract 1
- 238000010586 diagram Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 238000000034 method Methods 0.000 description 1
Abstract
Description
【発明の詳細な説明】
〔産業上の利用分野〕
本発明はテープレコーダの再生時にテープスピードを変
化させても発声音韻に変化なく早聞き。[Detailed Description of the Invention] [Industrial Field of Application] The present invention allows rapid listening without changing the utterance phoneme even if the tape speed is changed during playback by a tape recorder.
遅聞きのできるような音声処理装置に関するものである
。This invention relates to a speech processing device that allows slow listening.
従来、この種の音声処理装置の例としてはvSC(Va
riable 5peech Control )とい
う方式があシ、メモリに音声波形を書き込むスピードと
読み申すスピードを変えて、音韻の変化を防いでいた。Conventionally, an example of this type of audio processing device is vSC (Va
There was a method called riable 5peach Control) that prevented changes in phonology by changing the speed at which speech waveforms were written into memory and the speed at which they were interpreted.
上述した従来の音声処理装置におけるvSCは、音声の
波形のピッチにかかわシが〈波形の編集を行っているた
め、波形のつなぎ目゛で雑音を生じ、それが非常に耳ざ
わシに表るという課龜があった。The vSC in the conventional audio processing device described above edits the pitch of the audio waveform, so noise is generated at the joints of the waveforms, which is very noticeable. There was a division.
本発明の音声処理装置は、第1のクロック信号および第
2のクロック信号の2つのタイムベースクロック信号入
力端子を有し、音声信号をそれぞれ入力とするピッチ抽
出器とスペクトル分析器および逆フィルタが上記第1の
クロック信号で動作するようになし、合成フィルタが上
記第2のクロック信号で動作するようになし、上記逆フ
ィルタの出力を上記ピッチ抽出器の出力であるピッチ同
期毎Km集して上記合成フィルタに導くよりに構成され
、上記スペクトル分析器の石力が上記逆フィルタおよび
上記合成フィルタの特性を決定するような構成をとるも
のである。The audio processing device of the present invention has two time base clock signal input terminals, a first clock signal and a second clock signal, and includes a pitch extractor, a spectrum analyzer, and an inverse filter each receiving an audio signal as input. The synthesis filter is configured to operate with the first clock signal, the synthesis filter is configured to operate with the second clock signal, and the output of the inverse filter is collected every Km of pitch synchronization, which is the output of the pitch extractor. The inverse filter is guided to the synthesis filter, and the power of the spectrum analyzer is configured to determine the characteristics of the inverse filter and the synthesis filter.
本発明においては、残差の段階でピッチ周期にしたがっ
て編集することにより雑音の入らないスムーズ々音声を
得る。In the present invention, smooth speech without noise is obtained by editing according to the pitch period at the residual stage.
以下−図面に基づき本発明の実施例を詳細に説明する。 Hereinafter, embodiments of the invention will be explained in detail with reference to the drawings.
第1図は本発明の一実施例を示すブロック図である。FIG. 1 is a block diagram showing one embodiment of the present invention.
図において、1は音声入力端子である。2はスピード信
号入力端子、3は読出スピード信号入力・端子で、これ
らは第1のクロック信号および第2のクロック信号の2
つのタイムベースクロック信号入力端子を構成している
。4は音声出力端子でちる。In the figure, 1 is an audio input terminal. 2 is a speed signal input terminal, 3 is a read speed signal input/terminal, and these are two of the first clock signal and second clock signal.
It constitutes two time base clock signal input terminals. 4 is the audio output terminal.
5はA/Dコンバータ、6,7.8はそれぞれA/Dコ
ンバータ5の出力である音声信号を入力とするピッチ抽
出器とスペクトル分析器および逆フィルタで、このピッ
チ抽出器6とスペクトル分析器7および逆フィルタ8は
スピード信号入力端子2からのクロック信号で動作する
ように構成されている。9は編集器、10は合成フィル
タで、この合成フィルタ10は読出スピード信号入力端
子3からのクロック信号で動作するように構成されてい
る。11はD/Aコンバータである。5 is an A/D converter, and 6, 7.8 are a pitch extractor, a spectrum analyzer, and an inverse filter that receive the audio signal output from the A/D converter 5, respectively. 7 and the inverse filter 8 are configured to operate with a clock signal from the speed signal input terminal 2. 9 is an editor; 10 is a synthesis filter; this synthesis filter 10 is configured to operate with a clock signal from the read speed signal input terminal 3; 11 is a D/A converter.
そして、逆フィルタ8の出力をピッチ抽出器6の出力で
あるピッチ周期毎に編集して合成フィルタ10に導くよ
うに構成され、スペクトル分析器7の出力が逆フィルタ
8および合成フィルタ10の特性を決定するような構成
をとっている。The output of the inverse filter 8 is edited for each pitch period, which is the output of the pitch extractor 6, and is guided to the synthesis filter 10, and the output of the spectrum analyzer 7 determines the characteristics of the inverse filter 8 and the synthesis filter 10. It is structured in such a way that it makes a decision.
第2図および第3図は第1図の動作説BAK供する図で
、第2図は編集される波形人力スピード〉読出スピード
の場合を示したものであυ、第3図は゛編集される波形
入力スピード〈読出スピードの場合を示したものである
。なお、(a)は入力残差を示し、伽)は出力残差を示
す。Figures 2 and 3 are diagrams that provide the operation theory BAK of Figure 1. Figure 2 shows the case where the edited waveform manual speed is greater than the readout speed, and Figure 3 shows the edited waveform. This shows the case of input speed <read speed. Note that (a) indicates the input residual, and (a) indicates the output residual.
つぎに第1rlAK示す実施例の動作を第2図および第
3図を参照して説明する。Next, the operation of the embodiment shown in the first rlAK will be explained with reference to FIGS. 2 and 3.
まず、音声入力端子1に印加された音声信号はA/Dコ
ンバータ5でディジタルに変換される。First, an audio signal applied to the audio input terminal 1 is converted into a digital signal by the A/D converter 5.
この変換されるレートはスピード信号入力端子2に入力
されるテープレコーダのテープ速度に比例したクロック
信号による。そして、ディジタル化された音声はピッチ
抽出器6とスペクトル分析器7および逆フィルタ8にそ
れぞれ導かれる。ここで、このピッチ抽出器6とスペク
トル分析器Tおよび逆フィルタ8はA/Dコンバータ5
と同じタイミングクロックで動作している。The rate to be converted is determined by a clock signal proportional to the tape speed of the tape recorder input to the speed signal input terminal 2. The digitized speech is then guided to a pitch extractor 6, a spectrum analyzer 7, and an inverse filter 8, respectively. Here, the pitch extractor 6, spectrum analyzer T and inverse filter 8 are connected to the A/D converter 5.
It operates with the same timing clock.
つぎに、スペクトル分析器Tで得られたスペクトル信号
を利用して逆フィルタ8によって残差信号が得られる。Next, a residual signal is obtained by an inverse filter 8 using the spectrum signal obtained by the spectrum analyzer T.
この残差信号は編集器9に導かれ、ピップ抽出器6によ
プ得られたピッチ周期単位で編集される。This residual signal is led to an editor 9, and edited by the pip extractor 6 in pitch period units.
いま、スピード信号入力端子2からnKH2のクロック
信号が入力され、読出スピード信号入力端子からm K
Hzのクロック信号が入力された場合でn>mの場合に
は、編集器9に入力された残差信号のうち1ピッチ周期
分が切シ取られn7m倍に伸長されて再結合され出力さ
れる。このn=2mの場合をg2[ffiに示している
。々お、この第2図において、(イ)は捨てる部分を示
す。Now, a clock signal of nKH2 is input from the speed signal input terminal 2, and a clock signal of mKH2 is input from the read speed signal input terminal.
When a Hz clock signal is input and n>m, one pitch period of the residual signal input to the editor 9 is cut out, expanded by n7m times, recombined, and output. Ru. This case of n=2m is shown in g2[ffi. In this Figure 2, (a) indicates the part to be discarded.
そして、編集器9の出力は合成フィルタ10(スペクト
ル分析器7の出力によシ逆フィルタ8の逆の特性を示す
)K入力され、音韻情報の復元された音声信号が得られ
る。n>mの場合では早口の音声がピッチを上げずに出
力される。Then, the output of the editor 9 is inputted to a synthesis filter 10 (which has characteristics opposite to those of the inverse filter 8 based on the output of the spectrum analyzer 7), and a speech signal with phoneme information restored is obtained. When n>m, fast speech is output without raising the pitch.
逆Kn、<rnの場合には、テープ速度が標準よシ遅い
場合に@Wする。そして、この場合は第3図に示すよう
に入力残差(a)はn7m倍に縮少され復製されて合成
フィルタ10へ導かれる。In the case of reverse Kn and <rn, @W is performed when the tape speed is slower than the standard. In this case, as shown in FIG. 3, the input residual (a) is reduced by n7m times, reproduced, and guided to the synthesis filter 10.
々お、との第2図および第3図は、それぞれ人力/出力
スピード比が2 、1/3の場合を示しているが、その
比は整数またはその逆数である必要はなく、1.2とか
1.1 でちってもかまわない。Figures 2 and 3 show cases where the human power/output speed ratio is 2 and 1/3, respectively, but the ratio need not be an integer or its reciprocal; It doesn't matter if it is 1.1.
そして、編集の対象が相関のない残差信号でおるから、
雑音はない。And since the object of editing is the uncorrelated residual signal,
There's no noise.
なお、説明の都合上、A/Dコンバータ、 D/Aコン
バータを用いすべてディジタルでの実施例を示したが、
必ずしも値はディジタルである必要はな(、BBDなど
のアナログ記録素子を利用して離散時聞達!量のシステ
ムを作ることも容易である。For convenience of explanation, an all-digital example using an A/D converter and a D/A converter is shown.
The values do not necessarily have to be digital (it is also easy to create a system with discrete time readings using an analog recording device such as a BBD).
また、スピード信号入力端子2はテープスピードに連動
して、読出スピード信号入力端子3は固定とした使い方
がテープを早くしたシ遅くしても聞きとれるテープレコ
ーダとして通常の使い方であるが、スピード信号入力端
子2を固定にしたままで読出スピード信号入力端子3を
可変にすると、音色の変わった声をつくることができて
特殊効果を出すこともできる。In addition, the speed signal input terminal 2 is linked to the tape speed, and the read speed signal input terminal 3 is fixed, which is the normal usage for a tape recorder that can be heard even when the tape is sped up or slowed down. By making the read speed signal input terminal 3 variable while keeping the input terminal 2 fixed, it is possible to create a voice with a different timbre and to create special effects.
以上説明したように本発明は、残差の段階でピップ周期
にしたがって編集することにより雑音の入らないスムー
ズな音声を得ることができる効果がある。また、音声の
変わった声をつくることができて特殊効果を出すことも
できる。As explained above, the present invention has the advantage that smooth speech without noise can be obtained by editing according to the pip period at the residual stage. You can also create unusual voices and create special effects.
第1図は本発明の一実施例を示すブロック図、第2図お
よび第3図は第1図の動作説明に供する図である。
1・・・・音声入力端子、2・・・・スピード信号入力
端子、3・・・・読出スピード信号入力端子、6・・・
・ピッチ抽出器、T・・・・スヘクトル分析器、8・・
・・逆フィルタ、9・・・・編集器、10・・・・合成
フィルタ。
特許出願人 日本電気株式会社FIG. 1 is a block diagram showing one embodiment of the present invention, and FIGS. 2 and 3 are diagrams for explaining the operation of FIG. 1. 1...Audio input terminal, 2...Speed signal input terminal, 3...Reading speed signal input terminal, 6...
・Pitch extractor, T...Speech analyzer, 8...
... Inverse filter, 9... Editor, 10... Synthesis filter. Patent applicant: NEC Corporation
Claims (1)
タイムベースクロック信号入力端子を有し、音声信号を
それぞれ入力とするピッチ抽出器とスペクトル分析器お
よび逆フィルタが前記第1のクロック信号で動作するよ
うになし、合成フィルタが前記第2のクロック信号で動
作するようになし、前記逆フィルタの出力を前記ピッチ
抽出器の出力であるピッチ周期毎に編集して前記合成フ
ィルタに導くように構成され、前記スペクトル分析器の
出力が前記逆フィルタおよび前記合成フィルタの特性を
決定するような構成をとることを特徴とする音声処理装
置。A pitch extractor, a spectrum analyzer, and an inverse filter each having two time base clock signal input terminals, a first clock signal and a second clock signal, each receiving an audio signal, operate on the first clock signal. The synthesis filter is configured to operate with the second clock signal, and the output of the inverse filter is edited for each pitch period that is the output of the pitch extractor and guided to the synthesis filter. and an output of the spectrum analyzer determines characteristics of the inverse filter and the synthesis filter.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP63095693A JPH01267700A (en) | 1988-04-20 | 1988-04-20 | Speech processor |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP63095693A JPH01267700A (en) | 1988-04-20 | 1988-04-20 | Speech processor |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH01267700A true JPH01267700A (en) | 1989-10-25 |
Family
ID=14144575
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP63095693A Pending JPH01267700A (en) | 1988-04-20 | 1988-04-20 | Speech processor |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH01267700A (en) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1998021710A1 (en) * | 1996-11-11 | 1998-05-22 | Matsushita Electric Industrial Co., Ltd. | Sound reproducing speed converter |
US7024354B2 (en) | 2000-11-06 | 2006-04-04 | Nec Corporation | Speech decoder capable of decoding background noise signal with high quality |
KR100802186B1 (en) * | 1999-10-26 | 2008-02-11 | 소니 가부시끼 가이샤 | Apparatus and method for changing speed of playback |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5685799A (en) * | 1979-12-14 | 1981-07-13 | Sony Corp | Voice pitch converter |
JPS584200A (en) * | 1981-06-30 | 1983-01-11 | 富士通株式会社 | Musical interval correction system |
JPS5914752A (en) * | 1982-07-14 | 1984-01-25 | Morinaga & Co Ltd | Preparation of granular chocolate |
-
1988
- 1988-04-20 JP JP63095693A patent/JPH01267700A/en active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5685799A (en) * | 1979-12-14 | 1981-07-13 | Sony Corp | Voice pitch converter |
JPS584200A (en) * | 1981-06-30 | 1983-01-11 | 富士通株式会社 | Musical interval correction system |
JPS5914752A (en) * | 1982-07-14 | 1984-01-25 | Morinaga & Co Ltd | Preparation of granular chocolate |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1998021710A1 (en) * | 1996-11-11 | 1998-05-22 | Matsushita Electric Industrial Co., Ltd. | Sound reproducing speed converter |
US6115687A (en) * | 1996-11-11 | 2000-09-05 | Matsushita Electric Industrial Co., Ltd. | Sound reproducing speed converter |
KR100802186B1 (en) * | 1999-10-26 | 2008-02-11 | 소니 가부시끼 가이샤 | Apparatus and method for changing speed of playback |
US7024354B2 (en) | 2000-11-06 | 2006-04-04 | Nec Corporation | Speech decoder capable of decoding background noise signal with high quality |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3265962B2 (en) | Pitch converter | |
KR20000068955A (en) | Sound processing method, sound processor, and recording/reproduction device | |
JP3630609B2 (en) | Audio information reproducing method and apparatus | |
KR20010111630A (en) | Device and method for converting time/pitch | |
JPS5982608A (en) | System for controlling reproducing speed of sound | |
US4601052A (en) | Voice analysis composing method | |
JPH01267700A (en) | Speech processor | |
US4210781A (en) | Sound synthesizing apparatus | |
JPS642960B2 (en) | ||
JP3156020B2 (en) | Audio speed conversion method | |
USRE31172E (en) | Sound synthesizing apparatus | |
US4864626A (en) | Voice modifier | |
JP3147562B2 (en) | Audio speed conversion method | |
JPH1078791A (en) | Pitch converter | |
JPH09146587A (en) | Speech speed changer | |
JP4648183B2 (en) | Continuous media data shortening reproduction method, composite media data shortening reproduction method and apparatus, program, and computer-readable recording medium | |
KR100359988B1 (en) | real-time speaking rate conversion system | |
JPH06202692A (en) | Control system for speech reproducing speed | |
JP2669088B2 (en) | Audio speed converter | |
JPH0477320B2 (en) | ||
JPH05143088A (en) | Speech processor | |
KR100264389B1 (en) | Computer music cycle with key change function | |
JP2005204003A (en) | Continuous media data fast reproduction method, composite media data fast reproduction method, multichannel continuous media data fast reproduction method, video data fast reproduction method, continuous media data fast reproducing device, composite media data fast reproducing device, multichannel continuous media data fast reproducing device, video data fast reproducing device, program, and recording medium | |
JPH08305393A (en) | Reproducing device | |
JPH03123397A (en) | Device and method for converting voice speed |