JP3353994B2 - Noise reduced speech analyzer and noise reduced speech synthesis apparatus and a speech transmission system - Google Patents

Noise reduced speech analyzer and noise reduced speech synthesis apparatus and a speech transmission system

Info

Publication number
JP3353994B2
JP3353994B2 JP3718594A JP3718594A JP3353994B2 JP 3353994 B2 JP3353994 B2 JP 3353994B2 JP 3718594 A JP3718594 A JP 3718594A JP 3718594 A JP3718594 A JP 3718594A JP 3353994 B2 JP3353994 B2 JP 3353994B2
Authority
JP
Japan
Prior art keywords
noise
power spectrum
means
spectrum
subtraction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP3718594A
Other languages
Japanese (ja)
Other versions
JPH07248793A (en
Inventor
訓 古田
文啓 松岡
裕久 田崎
宏一 白木
純 石井
Original Assignee
三菱電機株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 三菱電機株式会社 filed Critical 三菱電機株式会社
Priority to JP3718594A priority Critical patent/JP3353994B2/en
Publication of JPH07248793A publication Critical patent/JPH07248793A/en
Application granted granted Critical
Publication of JP3353994B2 publication Critical patent/JP3353994B2/en
Anticipated expiration legal-status Critical
Application status is Expired - Fee Related legal-status Critical

Links

Abstract

PURPOSE:To reduce noisy feeling emphasized due to the influence of a subtraction error in auditory sense by partially superimposing a synthetic sound from a mean noise power spectrum as the output of the synthetic sound in a voiced sound section. CONSTITUTION:A mean power spectrum hold means 9 holds newly received transmission spectrum information 106 as the mean noise power spectrum 105 when voiced sound/noise decision information 102 received by an information reception means 8 is a noise frame. Then, a superimposition noise synthetic means 11 forms a superimposed noise 111 by using the mean noise power spectrum 105, and outputs the superimposed noise 111 whose amplitude is attenuated at a prescribed attenuation rate as an output synthetic sound 112 when the voiced sound/noise decision information 102 received by the information reception means 8 is the noise frame. On the other hand, the means 11 outputs the superimposed noise 111 to a voiced sound section synthetic sound output means 13 when the voiced sound/noise decision information 102 received by the means 8 is a voiced sound frame.

Description

【発明の詳細な説明】 DETAILED DESCRIPTION OF THE INVENTION

【0001】 [0001]

【産業上の利用分野】この発明は、音声信号に重畳した、蓄積、伝送目的外の環境雑音を抑圧する、雑音処理方式に関するものである。 BACKGROUND OF THE INVENTION This invention has been superimposed on the audio signal, accumulating, suppresses ambient noise outside the transmission purposes, to a noise reduction method.

【0002】 [0002]

【従来の技術】音声信号に重畳した、蓄積あるいは伝送目的外の環境雑音を抑圧する雑音処理方式としては、例えば、文献1、Steven F. Boll著、"Suppression of No Superimposed BACKGROUND ART audio signal, the noise processing method for suppressing ambient noise outside the storage or transmission purposes, for example, Document 1, Steven F. Boll al, "Suppression of No
ise inSpeech Using Spectral Subtraction",(IEEE Tra ise inSpeech Using Spectral Subtraction ", (IEEE Tra
ns. Acoust., Speech, SignalProcessing, vol. ASSP-2 ns. Acoust., Speech, SignalProcessing, vol. ASSP-2
7, pp113-120, Apr. 1979)に示されている方式が挙げられる。 7, pp113-120, include methods shown in Apr. 1979). この方法は、雑音区間、即ち蓄積あるいは伝送目的外の区間から、同区間のスペクトルを推定し、それを全区間の各パワースペクトルから減算することによって雑音抑圧を行う方法である。 This method, noise section, i.e. from the storage or transmission purposes outside the section to estimate the spectrum of the same section, is a method of performing noise suppression by subtracting it from the power spectrum of the entire section.

【0003】図11は、文献1に示される雑音処理方式の一構成例を示すブロック図である。 [0003] Figure 11 is a block diagram showing an example of the configuration of the noise reduction scheme shown in Reference 1. 図11において、 11,
2は有音/雑音判定手段、3はスペクトル分析手段、4 2 voice / noise determination means, spectrum analysis means 3, 4
はスペクトル減算手段、5は平均雑音パワースペクトル算出手段、101は音声信号、102は有音/雑音判定情報、103はスペクトル、104は雑音引き去りパワースペクトル、105は平均雑音パワースペクトルである。 Spectral subtraction means, 5 is the average noise power spectrum calculation unit, 101 audio signal, 102 speech / noise determination information, the 103 spectral, 104 noise subtraction power spectrum, is 105 is the average noise power spectrum.

【0004】以下、図11を用いて、従来の雑音処理方式の一構成例の動作について説明する。 [0004] Hereinafter, with reference to FIG. 11, the operation of an example of the configuration of a conventional noise reduction method. 有音/雑音判別手段2は、入力された音声信号101を所定の長さの分析フレーム単位に分割し、各分析フレームが、有音区間、即ち蓄積あるいは伝送対象の音声区間であるか、雑音区間、即ち蓄積あるいは伝送対象外の雑音区間であるかを判別し、結果を有音/雑音判定情報102として出力する。 Speech / noise discrimination means 2 divides the audio signal 101 that is input to the analysis frames of predetermined length, each analysis frame is voiced section, i.e. whether it is accumulated or be transmitted in a speech period, noise interval, i.e. to determine a storage or transmission covered by the noise section, and outputs the result as speech / noise determination information 102. 一方、スペクトル分析手段3は、入力された音声信号101を、前記分析フレーム単位で分析し、各々の分析フレームのパワースペクトル103を出力する。 On the other hand, the spectral analysis means 3, a speech signal 101 that is input, analyzed by said analysis frame, and outputs the power spectrum 103 of each analysis frame of.
有音/雑音判定情報102が雑音フレームの場合、平均雑音パワースペクトル算出手段5は、スペクトル分析手段3で得られている、当該雑音フレーム区間のパワースペクトル103と、過去の平均雑音パワースペクトル1 If speech / noise determination information 102 of the noise frame, the average noise power spectrum calculating means 5 is obtained by spectral analysis means 3, the power spectrum 103 of the noise frame interval, past average noise power spectrum 1
05を用いて、平均雑音パワースペクトル105の更新を行い、更新された平均雑音パワースペクトル105を出力し、さらにスペクトル減算手段4は、パワースペクトル103から平均雑音パワースペクトル105を差し引いた、雑音引き去りパワースペクトル104を算出し、出力する。 05 using, updates the average noise power spectrum 105, and outputs the average noise power spectrum 105 updated, further spectral subtraction unit 4, by subtracting the average noise power spectrum 105 from the power spectrum 103, noise subtraction Power calculating a spectrum 104, and outputs. 有音/雑音判定情報102が有音フレームの場合には、スペクトル減算手段4において、当該有音フレーム区間のパワースペクトル103から、現処理フレームから見て直前の雑音フレームまでの、平均雑音パワースペクトル105に全帯域に固定かつ一定のゲインを乗じたものを差し引き、得られた雑音引き去りパワースペクトル104を出力する。 When speech / noise determination information 102 is voice frames, in the spectral subtraction means 4, from the power spectrum 103 of the voiced frame section, to the noise frame immediately before when viewed from the current processing frame, the average noise power spectrum subtracting the multiplied by a fixed and constant gain the entire band to 105, and outputs the noise subtraction power spectrum 104 was obtained.

【0005】 [0005]

【発明が解決しようとする課題】図11に示される従来の雑音処理方式においては、蓄積あるいは伝送目的外の雑音が重畳している各フレームのパワースペクトル10 In the conventional noise reduction scheme shown in FIG. 11 [0007] The power spectrum of each frame noise outside the storage or transmission purposes is superposed 10
3から、平均雑音パワースペクトル105を差し引いた、雑音引き去りパワースペクトル104を求め、これを真に蓄積あるいは伝送を目的とする音声情報のスペクトルであるとして用いている。 3, minus the average noise power spectrum 105, noise subtraction obtains a power spectrum 104 is used truly accumulation or transmits it as a spectrum of the audio information of interest. この方法によれば、雑音が定常である場合には音声信号101に重畳した蓄積あるいは伝送目的外の雑音を取り除くことができるが、一般に雑音は非定常であり、このため平均雑音パワースペクトル算出手段5において、安定な平均雑音パワースペクトル105の推定が困難であり、スペクトル減算手段4で求められた、雑音引き去りパワースペクトル104 According to this method, the noise can be removed noise outside the storage or transmission purposes is superimposed on the audio signal 101 when it is stationary, generally noise is non-stationary and therefore the average noise power spectrum calculating means in 5, it is difficult to estimate the stable average noise power spectrum 105, obtained by the spectrum subtraction means 4, the noise subtraction power spectrum 104
に、雑音の非定常部分が引き去り誤差として残り、結果として雑音引き去りパワースペクトル104を用いて合成した合成音は、聴覚的に、かえって雑音感が強調されてしまうという課題があった。 , The synthesized synthesis sound with the noise subtraction power spectrum 104 rest, as a result as an error Abnormality of noise subtraction is audibly, there is rather a problem that the feeling of noise from being emphasized.

【0006】また、平均雑音パワースペクトル105を引き去るとき、常に全帯域に固定かつ一定の引き去り率を用いているため、平均雑音パワースペクトル105の推定がうまく行われた場合にも、フレームや帯域によっては引き去り過剰により、引き去りパワースペクトルが大きく変形してしまったり、引き去り誤差が発生してしまうという課題があった。 Further, when subtracting the average noise power spectrum 105 always due to the use of fixed and constant subtraction factor the entire band, even when the estimate of the average noise power spectrum 105 has been performed successfully, the frame and the band excessive subtraction by, or power spectrum gone largely deformed subtraction, subtraction error is a problem that occurs. さらに、雑音引き去りパワースペクトル104を、蓄積あるいは伝送を目的とする分析合成系の音声符号化方式の伝送スペクトル情報として用いた場合、分析合成系の単純なモデリングでは、前記引き去り誤差を正確に再現できないため、引き去り誤差が変形して、不自然な雑音を発生するという課題があった。 Furthermore, the noise subtraction power spectrum 104, in the case of using the accumulated or transmitted as a transmission spectral information analysis-synthesis system speech encoding system of interest, a simple modeling analysis synthesis system, can not be reproduced accurately the subtraction error Therefore, subtraction and error is deformed, there is a problem of generating unnatural noise.

【0007】図12乃至図15は、上記分析合成系の音声符号化方式(ここではハーモニックコーダー)と共に図11の従来例を用いた場合の、引き去り誤差の変形の様子をスペクトル包絡の時間推移を用いて説明する説明図である。 [0007] FIGS. 12 to 15, the case (here the harmonic coder) the analysis-synthesis system of the speech coding method using the conventional example of FIG. 11 with, subtraction time transition of the spectral envelope of the deformed state of the error it is an explanatory diagram for explaining with reference. 図12のような原音声信号に対して、図13 With respect to the original audio signal as shown in FIG. 12, FIG. 13
のように、定常な白色雑音を重畳させた(SNR5d As in, it overlapped with the stationary white noise (SNR5d
B)音声信号を用意し、従来例による前処理を行わずにハーモニックコーダーで符号化し復号した合成音の例を図14に、図11の構成による従来例を用いて前処理を施し、ハーモニックコーダーで符号化し復号した合成音の例を図15に示す。 B) providing a speech signal, Figure 14 is an example of a coded decoded synthesized sound harmonic coder without pretreatment with the prior art, subjected to a pretreatment using conventional example according to the configuration of FIG. 11, a harmonic coder examples of in coded decoded synthetic speech is shown in FIG. 15. 図15を観察すると、従来例による前処理を施したため、重畳した雑音はある程度引き去られてはいるが、特に有音区間において、小振幅のスペクトル包絡のピークが、フレーム単位に不連続に出現している。 Upon examining Figure 15, for pretreated according to the conventional example, the noise superimposed is may be somewhat subtracted, particularly in voiced section, the peak of the spectral envelope of the small amplitude, discontinuously appearing on frame doing. 前処理を行わない場合の図14の合成音には上記の不連続は見られないことから、引き去り誤差が誤ったモデリングの結果変形されているものと考えられる。 It resulted in no discontinuity of the prior synthesized speech in Figure 14 when processing is not performed, are considered to have been the result deformation modeling the wrong subtraction error.
但し図14では、図15の場合ほど、極端な包絡ピークの不連続は見られないものの、原音声信号の特徴が雑音に埋もれており、正確に再現されているとはいえない。 However in Figure 14, as in the case of FIG. 15, although not extreme discontinuities envelope peaks observed, characteristic of the original speech signal and is buried in noise, it can not be said that accurately reproduced.
従来の雑音処理方式では、この雑音処理方式を用いない場合に比べ効果はあるものの、上記引き去り誤差の変形にともなう包絡ピークの不連続が、不自然な雑音となって聴取されるという問題があり、実用的ではないという課題があった。 In the conventional noise reduction method, although this noise processing scheme some cases effective compared to using no discontinuity of the subtraction error envelope peak caused by deformation of, there is a problem that is listened in an unnatural noise , there is a problem that is not practical.

【0008】この発明はこれらの課題を解決するためになされたもので、前記引き去り誤差の影響により強調される雑音感を、聴覚的に軽減する雑音抑圧音声分析装置、雑音抑圧音声合成装置を得ることを目的としている。 [0008] The present invention has been made to solve these problems, a noise feeling is emphasized by the influence of the subtraction errors, noise reduced speech analyzer that audibly reduce, obtain noise reduced speech synthesizer It is aimed at. また、過剰な引き去りに伴うスペクトル変形や前記引き去り誤差が出にくい雑音引き去りを行うことで、良好な雑音抑圧を行った雑音抑圧音声分析装置、雑音抑圧音声合成装置及び音声伝送システムを得ることを目的としている。 By performing the subtraction spectrum deformation and the subtraction difficult noise out errors due to excessive subtraction noise suppression speech analysis apparatus that has performed a good noise suppression, intended to obtain a noise reduced speech synthesis apparatus and a speech transmission system It is set to.

【0009】 [0009]

【課題を解決するための手段】この発明に係る雑音抑圧音声分析装置は、 入力音声信号を所定の分析フレーム単 Means for Solving the Problems] noise reduced speech analyzer according to the present invention, the input audio signal to predetermined analysis frame single
位毎にスペクトル分析してパワースペクトルを求めるス Scan to determine the power spectrum and spectrum analysis for each position
ペクトル分析手段と、上記分析フレームの内の雑音区間 A spectrum analyzing unit, the noise section of the analysis frame
フレームに対して規定のフレーム分の平均雑音パワース The average noise Pawasu of the frame of the provisions with respect to the frame
ペクトルを求める平均雑音パワースペクトル算出手段 Average noise power spectrum calculating means for calculating a spectrum
と、上記スペクトル分析手段出力に上記平均雑音パワー When, the average noise power in the spectral analysis means outputs
スペクトルを減算した雑音引き去りパワースペクトル Noise subtraction power spectrum obtained by subtracting the spectrum
と、上記平均雑音パワースペクトルとを選択し、伝送ス If, select and the average noise power spectrum, transmission scan
ペクトルとして送信する伝送スペクトル選択伝送手段を The transmission spectrum selection transmitting means for transmitting the spectrum
備えた。 With was.

【0010】 [0010]

【0011】また更に、雑音フレーム区間では、送信するパワースペクトルとして雑音フレーム区間の瞬時雑音パワースペクトルを送信するようにした。 [0011] Further, in the noise frame interval, and to transmit the instantaneous noise power spectrum of the noise frame section as a power spectrum to be transmitted.

【0012】 この発明に係る雑音抑圧音声合成装置は、 [0012] The noise suppression speech synthesis device according to the present invention,
入力音声信号を所定の長さの分析フレーム単位で分割 Dividing the input speech signal in the analysis frame having a predetermined length
し、この分析フレームを有音区間フレームと雑音区間フ And, voiced section frame and noise section off this analysis frame
レームに分け、雑音区間フレームに対してはスペクトル Divided into frames, the spectrum for the noise section frame
分析して平均雑音パワースペクトルを記憶する平均雑音 The average noise analysis to store the mean noise power spectrum
パワースペクトル保持手段と、平均雑音パワースペクト A power spectrum holding means, the average noise power spectrum
ルを入力として合成音を生成する重畳雑音合成手段と、 And superimposing the noise synthesizing means for generating a synthesized sound Le as input,
入力信号が有音区間の場合は、入力の有音区間の音声信 If the input signal is voiced section, the audio signal of voiced section of the input
号と、重畳雑音合成手段出力の合成音とを所定の重畳倍 No. and a predetermined superposed times and synthesized sound of the superimposed noise combining means output
率をかけて重畳して有音区間の合成音を生成して出力す Superimposed over the rate generates a synthesized sound of voiced section by Outputs
る有音区間合成音出力手段と、有音区間合成音出力手段 And voiced interval synthesized sound output means that, voiced section synthesized sound output means
と重畳雑音合成手段出力とにより重畳倍率を計算し制御 Calculation controlling the superimposing magnification by superimposing the noise combining means output
し、入力信号が雑音区間の場合は、重畳雑音合成手段出 And, if the input signal is a noise interval, leaving superimposed noise synthesizing means
力に重畳倍率をかけて雑音区間の合成音を出力するよう To output the synthesized sound of the noise section over the superposition ratio to the force
制御する重畳倍率制御手段と、を備えた。 A superimposing ratio control means for controlling, with a.

【0013】または、入力音声信号を所定の長さの分析 [0013] or, analysis of the input speech signal by a predetermined length
フレーム単位で分割し、分析フレームを有音区間フレー Divided in units of frames, voiced section frame the analysis frame
ムと雑音区間フレームに分け、雑音区間フレームに対し Divided into the arm and the noise section frame, with respect to the noise section frame
てはスペクトル分析して平均雑音パワースペクトルを記 Serial the average noise power spectrum and spectrum analysis Te
憶する平均雑音パワースペクトル保持手段と、平均雑音 And average noise power spectrum holding means for憶, average noise
パワースペクトルを入力として合成音を生成する重畳雑 Superimposing miscellaneous generating synthetic speech power spectrum as an input
音合成手段と、有音区間フレームのスペクトルを所定の And sound synthesizing means, spectrum a predetermined of voiced section frame
周波数帯域に区切って帯域別に重畳倍率を制御する帯域 Band to control the superimposed magnification by bands, separated in frequency band
別重畳倍率制御手段と、入力信号が有音区間の場合は、 And another superimposition ratio control means, if the input signal is voiced interval,
入力の有音区間の音声信号と、重畳雑音合成手段出力の合成音とを帯域別重畳手段が制御する重畳倍率をかけて重畳して有音区間の合成音を生成して出力する有音区間合成音出力手段と、を備えた。 And the audio signal of the input of the voiced interval, superposing the noise synthesizing means outputs synthesized speech and the per-band superposition means voiced section for generating and outputting the synthesized sound of the superimposed over the superposition ratio controlling voiced interval and synthesized sound outputting means, comprising a.

【0014】また更に、 平均雑音パワースペクトル保持 [0014] In addition, the average noise power spectrum held
手段は、瞬時雑音パワースペクトルが送信された場合 It means, if the instantaneous noise power spectrum is transmitted
は、該瞬時雑音パワースペクトルを規定のフレーム分平 Is, frames flat of defining the instantaneous when the noise power spectrum
均化して平均雑音パワースペクトルとして記憶し、雑音 Disproportionation and stored as average noise power spectrum, the noise
区間フレームでは、送信された瞬時雑音パワースペクト In the section frame, the instantaneous noise power has been transmitted spectrum
ルまたは上記平均雑音パワースペクトルを基に出力する Outputs based on Le or the average noise power spectrum
ようにした。 It was so.

【0015】また更に、スペクトル分析手段出力から平均雑音パワースペクトル算出手段出力を減算率を掛けて減算して雑音引き去りパワースペクトルを求めるスペクトル減算手段と、上記スペクトル分析手段出力の値により上記減算率を定める引き去り率算出手段を備えて、有音フレーム区間では上記雑音引き去りパワースペクトルを伝送するようにした。 [0015] In addition, the spectral subtraction means for obtaining a noise subtraction power spectrum by subtracting over a subtraction rate average noise power spectrum calculating unit output from the spectrum analyzing means output, said subtraction rate according to the value of the spectral analysis means outputs includes a subtraction rate calculation means determining, in voiced frame section is so as to transmit the noise subtraction power spectrum.

【0016】また更に、引き去り率算出手段は、有音区間のスペクトル分析手段出力の周波数帯域別に引き去り率を算出するようにし、スペクトル減算手段は、上記周波数帯域別の引き去り率で平均雑音パワースペクトルを減算するようにした。 [0016] Further, subtraction ratio calculating means calculate the spectral analysis means outputs each frequency band to the subtraction rate of the sound period, the spectral subtraction means, an average noise power spectrum in the frequency band separate subtraction rate It was to be subtracted.

【0017】また更に、引き去り率算出手段は、有音区間の雑音引き去りパワースペクトル出力をみて予め定めたしきい値以下になると、この雑音引き去りスペクトル出力が予め定めたしきい値を出力するようにした。 [0017] Further, subtraction ratio calculation means, and becomes equal to or less than the predetermined threshold value looked power spectral output subtraction noise sound period, to output the noise subtraction threshold spectrum output is predetermined did.

【0018】この発明に係る音声伝送システムは、入力音声信号を所定の分析フレーム単位毎にスペクトル分析してパワースペクトルを求めるスペクトル分析手段と、 The audio transmission system according to the present invention, a spectral analysis means for obtaining a power spectrum by spectral analyzes input speech signal for each predetermined analysis frame,
上記分析フレームの内の雑音区間フレームに対して規定のフレーム分の平均雑音パワースペクトルを求める平均雑音パワースペクトル算出手段と、上記スペクトル分析手段出力から上記平均雑音パワースペクトルを減算した雑音引き去りパワースペクトルと、上記平均雑音パワースペクトルとを選択し、伝送スペクトルとして送信する伝送スペクトル選択伝送手段を備えた雑音抑圧音声分析装置と、伝送された分析フレーム毎の信号の雑音区間フレームに対しては、そのスペクトルに対応して平均雑音パワースペクトルを記憶する平均雑音パワースペクトル保持手段と、上記平均雑音パワースペクトルを入力として合成音を生成する重畳雑音合成手段と、入力信号が有音区間の場合は、入力の有音区間の音声信号と上記重畳雑音合成手段出力 And average noise power spectrum calculating means for calculating an average noise power spectrum of the frame defined with respect to noise period frame of said analysis frame, and the noise subtraction power spectrum obtained by subtracting the average noise power spectrum from the spectrum analyzing means outputs the average select the noise power spectrum, the noise reduced speech analyzer having a transmission spectrum selection transmitting means for transmitting a transmission spectrum for the noise section frame signal for each analysis frame which is transmitted, the spectrum corresponding to the average noise power spectrum holding means for storing the mean noise power spectrum, and superimposing the noise synthesizing means for generating a synthesized speech as inputs the average noise power spectrum, if the input signal is voiced section, the input audio signal and the superimposing noise synthesis means outputs the sound period 合成音とを重畳して有音区間の合成音を生成する有音区間合成音出力手段を備えた雑音抑圧音声合成装置とで構成するようにした。 And to constitute between the noise reduced speech synthesis apparatus which includes a sound interval synthesized sound output means for generating a synthesized sound of superposition to voiced interval and a synthesized sound.

【0019】また更に、音声伝送システム中の各装置を、平均雑音パワースペクトルを可変の減算率で減算して雑音引き去りパワースペクトルとした雑音抑圧音声分析装置とし、入力の有音区間の合成音に、重畳雑音合成手段出力を可変の重畳倍率を掛けて重畳して有音区間の合成音を生成するようにした雑音抑圧音声合成装置とした。 [0019] Furthermore, each device in the audio transmission system, the average noise power spectrum by subtracting a variable subtraction factor and a noise reduced speech analyzer and noise subtraction power spectrum, the synthesized sound of the voiced interval in the input and a noise reduced speech synthesizing apparatus that generates a synthesized sound of the superimposed noise synthesis means outputs the superimposed over the variable superimposed magnification voiced interval.

【0020】 [0020]

【作用】この発明による雑音抑圧音声分析装置は、伝送 [Action] noise suppression sound analysis device according to the present invention, the transmission
スペクトル選択伝送手段を備えて、雑音引き去りパワー It comprises a spectrally selective transmission means, noise subtraction Power
スペクトルと平均雑音パワースペクトルのどちらか一方 On the other hand one of the spectrum and the average noise power spectrum
が選択されて伝送される。 There are transmitted is selected.

【0021】 [0021]

【0022】また更に、伝送する雑音パワースペクトルとして、各雑音フレーム区間の瞬時雑音パワースペクトルが伝送される。 [0022] Furthermore, as the noise power spectrum to be transmitted, the instantaneous noise power spectrum of each noise frame section is transmitted.

【0023】 [0023]

【0024】また更に、有音区間の合成出力音として、 [0024] Furthermore, as the combined output sound of the sound period,
伝送された有声音対応のパワースペクトルに雑音パワースペクトルからの合成音がある倍率で重畳されて得られ、雑音フレーム区間では、平均雑音パワースペクトルにある倍率を掛けて合成音が得られる。 Is superimposed at the magnification is transmitted voiced corresponding synthesized sound from the noise power spectrum to the power spectrum of the obtained, in the noise frame interval, synthesized speech is obtained by multiplying the magnification in the average noise power spectrum.

【0025】また更に、有音区間の合成音の出力として、伝送された有声音の周波数帯域別に区切られたスペクトル毎に重畳倍率が計算され、有声音対応のパワースペクトルに雑音パワースペクトルからの合成音が上記スペクトル毎に計算された各倍率で重畳されて得られる。 [0025] Further, as the output of the synthesized sound of the voiced section, superimposed magnification is calculated for each separated by a frequency band of the transmitted voiced spectrum, synthesis from noise power spectrum to power spectrum of the voiced sound corresponding sound obtained are superimposed on each magnification calculated for each of the spectrum.

【0026】また更に、伝送すべき有音区間のパワースペクトルとして、有音区間フレームのパワースペクトルから、ある可変の減算率で平均雑音スペクトルを引き去った雑音引き去りパワースペクトルが伝送される。 [0026] Further, as the power spectrum of the sound period to be transmitted, from the power spectrum of the sound period frame, the noise subtraction power spectrum Hikisa' the average noise spectrum subtraction index of a variable is transmitted.

【0027】また更に、伝送すべき有音区間のパワースペクトルとして、有音区間フレームの有声音の周波数帯域別に区切られたスペクトル毎に減算率が計算され、有音区間フレームのパワースペクトルから、上記スペクトル毎に計算された各減算率で平均雑音スペクトルを引き去った、雑音引き去りパワースペクトルが伝送される。 [0027] Furthermore, as the power spectrum of the sound period to be transmitted, the subtraction factor for each spectrum separated by the voiced sound of the frequency band of the sound period frame is calculated, from the power spectrum of the sound period frame, the It was Hikisa' the average noise spectrum on each subtraction rate is calculated for each spectral noise subtraction power spectrum is transmitted.

【0028】また更に、伝送すべき有音区間のパワースペクトルとして、有音区間フレームのパワースペクトルから、ある可変の減算率で平均雑音スペクトルを引き去るが、引き去った後の雑音引き去りパワースペクトルが一定のしきい値以上であるよう減算されて雑音引き去りパワースペクトルが伝送される。 [0028] Furthermore, as the power spectrum of the sound period to be transmitted, from the power spectrum of the voiced section frame, but subtracting the average noise spectrum subtraction index of a variable, noise subtraction power spectrum after Hikisa' subtracted by the noise subtraction power spectrum to be a more certain threshold are transmitted.

【0029】この発明による音声伝送システムは、送信側の雑音抑圧音声分析装置では雑音パワースペクトルも伝送され、受信側の雑音抑圧音声合成装置では、有音区間の合成音の出力として雑音引き去りパワースペクトルから合成した有声音に、平均雑音パワースペクトルからの合成音を一部重畳されて出力される。 The voice transmission system according to the present invention, the noise power spectrum is a noise reduced speech analyzer of the transmission side is transmitted, in a noise reduced speech synthesizing apparatus on the receiving side, the power spectrum subtraction noise as the output of the synthesized sound of the sound period the synthesized voiced from, and output is partly overlap the synthesized sound from the average noise power spectrum.

【0030】また更に、送信側では、平均雑音パワースペクトルを可変減算した雑音引き去りパワースペクトルが生成されて伝送され、受信側では、入力の有音に可変倍率で雑音パワースペクトルからの合成音が重畳されて出力される。 [0030] Furthermore, on the transmitting side, the average noise power noise subtraction power spectrum was variable subtracting the spectrum are transmitted are generated, on the receiving side, the synthesized sound from the noise power spectrum in a variable magnification to a sound input is superimposed which is to be output.

【0031】 [0031]

【実施例】 【Example】

実施例1. Example 1. 本実施例は、送信側の分析装置においては、 This embodiment, in the analyzer of the transmission side,
雑音区間の信号として平均雑音スペクトルを選択して送信することに特徴があり、受信側の合成装置においては、有音区間の合成音に平均雑音スペクトルを一部重畳して出力することに特徴がある。 Is characterized in that selectively sends average noise spectrum as a signal of the noise interval, in the synthesis apparatus of the receiving side, characterized in that the output by superimposing a part of average noise spectrum to the synthesized sound of the sound period is there. 図1は、本発明による雑音抑圧音声合成装置と雑音抑圧音声分析装置の一実施例のブロック図である。 Figure 1 is a block diagram of an embodiment of a noise reduced speech synthesis apparatus and the noise reduced speech analyzer according to the present invention. 図中新規な部分は、6の伝送スペクトル選択手段、7の情報伝送手段、8の情報受信手段、9の平均雑音パワースペクトル保持手段、11の重畳雑音合成手段、12の雑音区間合成音出力手段、13 Figure in the novel parts, the transmission spectrum selecting means 6, 7 of the information transmission means, information receiving means 8, the average noise power spectrum holding means 9, superimposed noise synthesis means 11, 12 noise segment synthesized sound output means , 13
の有音区間合成音出力手段である。 Is a voiced section synthetic speech output means. また、106は伝送スペクトル情報、105の平均雑音パワースペクトル、 Further, the transmission spectrum information 106, the average noise power spectrum 105,
111は重畳雑音、112は出力音声、200は伝送路である。 111 superimposed noise, 112 outputs sound, 200 is a transmission path.

【0032】以下、図1に示した音声分析装置と音声合成装置の一実施例の動作について説明する。 [0032] Hereinafter, description will be given of the operation of an embodiment of a speech analysis apparatus and the speech synthesis device shown in FIG. 有音/雑音判別手段2は、入力された、所定のサンプリング周期(ここでは8000Hz)でサンプリングしてある音声信号101を所定の長さの分析フレーム単位(ここでは20msec)に分割し、各分析フレームが、有音区間、即ち蓄積あるいは伝送対象の区間であるか、雑音区間、即ち蓄積あるいは伝送対象外の区間であるかを判別し、結果を有音/雑音判定情報102として出力する。 Speech / noise discrimination means 2 is input, is divided into a predetermined sampling period (here 8000 Hz) in the sampled audio signal 101 of a predetermined are length of the analysis frame unit (20 msec in this case), each analysis frames, voiced section, i.e. whether it is accumulated or be transmitted in the section, the noise segment, i.e. to determine a storage or transmission covered by section, and outputs the result as speech / noise determination information 102.
この有音/雑音判定手段2は公知の音声符号化方式に用いられる方法を用いて構成している。 The speech / noise determination unit 2 is configured by using the method used in known speech coding schemes. 同時にスペクトル分析手段3は、入力された前記音声信号101を、前記分析フレーム単位にスペクトル分析を行う。 Spectral analysis means 3 at the same time, the audio signal 101 that is input, performs a spectral analysis on the analysis frame. ここでは当該分析フレームを中心とするサンプル数256点のFF FF here sample 256 points around the analysis frame
T(高速フーリエ変換)を用いてスペクトル分析し、各スペクトルの振幅値の2乗を計算し、パワースペクトル103を出力する。 And spectral analysis using the T (Fast Fourier Transform), the square of the amplitude value of each spectrum is calculated, and outputs the power spectrum 103.

【0033】有音/雑音判定情報102が雑音フレームの場合、平均雑音パワースペクトル算出手段5は、スペクトル分析手段3で得られている、当該雑音フレーム区間のパワースペクトル103と、バッファ内に保持されている過去の平均雑音パワースペクトル105を用いて、逐次それらの平均算出を行い、バッファ内の平均雑音パワースペクトル105の更新を行い、次に更新された平均雑音パワースペクトル105を出力する。 [0033] When speech / noise determination information 102 of the noise frame, the average noise power spectrum calculating means 5 is obtained by spectral analysis means 3, the power spectrum 103 of the noise frame interval, held in the buffer by using historical average noise power spectrum 105 performs sequential averaging thereof updates the average noise power spectrum 105 in the buffer, then outputs the updated average noise power spectrum 105. 一方、 on the other hand,
有音/雑音判定情報102が有音フレームの場合には、 When speech / noise determination information 102 is voice frame,
スペクトル減算手段4において、当該有音フレーム区間のパワースペクトル103から、平均雑音パワースペクトル算出手段5のバッファ内に保持されている平均雑音パワースペクトル105に、1.0程度の所定の固定的なゲインを乗じたものを差し引いた、雑音引き去りパワースペクトル104を算出し出力する。 In spectral subtraction unit 4, the the power spectrum 103 of the sound frame section, the average noise power spectrum 105 which is held in the buffer of the average noise power spectrum calculating unit 5, about 1.0 of a predetermined fixed gain minus multiplied by a noise subtraction and outputs the calculated power spectrum 104. この算出はスペクトルの各値の差を計算することで得られる。 This calculation is obtained by calculating the difference between the value of the spectrum.

【0034】伝送スペクトル選択手段6では、有音/雑音判定情報102が雑音フレームの場合、その時点で、 [0034] In the transmission spectrum selection unit 6, when speech / noise determination information 102 of the noise frame, at which time,
平均雑音パワースペクトル算出手段5で算出され、更新されてバッファ内に取り込まれた平均雑音パワースペクトル105を、スイッチ選択し、伝送スペクトル情報1 Is calculated by the average noise power spectrum calculating unit 5, the average noise power spectrum 105 taken in the buffer is updated, and switch selection, the transmission spectrum information 1
06として出力する。 And outputs it as 06. 有音/雑音判定情報102が有音フレームの場合、スペクトル減算手段4で算出された雑音引き去りパワースペクトル情報104を選択し、伝送スペクトル情報106として出力する。 If speech / noise determination information 102 is voice frame, and select the noise subtraction power spectrum information 104 calculated by the spectral subtraction means 4, and outputs as a transmission spectrum information 106. これを情報伝送手段7は、当該処理フレームの有音/雑音判定情報10 This information transmission means 7, voice / noise determination information 10 of the process frame
2及び伝送スペクトル情報106を、伝送路200における伝送形態にあわせて符号化乃至変調を行い、伝送路200を通じて伝送する。 2 and the transmission spectrum information 106, performs encoding or modulation in accordance with the transmission form in the transmission path 200, and transmits through the transmission path 200.

【0035】一方、受信側の音声合成装置においては、 On the other hand, in the speech synthesizing apparatus on the receiving side,
情報受信手段8が判定情報102と伝送スペクトル情報106を伝送路200から受け取る。 Information receiving means 8 receives the determination information 102 and the transmission spectrum information 106 from the transmission path 200. 情報受信手段8 Information receiving means 8
は、受信情報の復調乃至復号化後、受け取った有音/雑音判定情報102及び伝送スペクトル情報106を出力する。 Outputs demodulated through decoding of the received information, the sound / noise determination information 102 and the transmission spectrum information 106 received. 本実施例では、有音/雑音判定情報102及び伝送スペクトル情報106の符号化・復号化方式としてハーモニックコーダーを用いており、伝送路200は無線通信路を用いている。 In this embodiment, uses a harmonic coder as encoding and decoding method of speech / noise determination information 102 and the transmission spectrum information 106, transmission line 200 uses a wireless communication path.

【0036】平均雑音パワースペクトル保持手段9は、 The average noise power spectrum holding means 9,
情報受信手段8で受信された有音/雑音判定情報102 Received by the information receiving unit 8 the speech / noise determination information 102
が雑音フレームの場合、それまでに保持されている伝送スペクトル情報106を更新して、新たに受信された伝送スペクトル情報106を、平均雑音パワースペクトル105として保持する。 If is the noise frame, and updates the transmission spectrum information 106 held so far, the transmission spectrum information 106 received newly, held as average noise power spectrum 105. その構成要素として、1フレーム分の平均雑音パワースペクトル105を記憶するバッファがある。 As its components, there is a buffer for storing the mean noise power spectrum 105 for one frame.

【0037】重畳雑音合成手段11は、平均雑音パワースペクトル105を用いて重畳雑音111を作成し、情報受信手段8で受信された有音/雑音判定情報102が雑音フレームの場合、重畳雑音111の振幅を所定の減衰率(ここでは0.8)で減衰したものを、出力合成音112として出力する。 The superimposed noise synthesizing means 11 uses the average noise power spectrum 105 to create a superimposed noise 111, speech / noise determination information 102 received by the information receiving means 8 For noise frame, the superimposed noise 111 an amplitude predetermined attenuation rate those attenuated (here 0.8), as the output synthesized sounds 112. 一方、情報受信手段8で受信された有音/雑音判定情報102が有音フレームの場合、 On the other hand, if the voiced / noise determination information 102 received by the information receiving means 8 of voice frames,
重畳雑音111を、後述する有音区間合成音出力手段1 The superimposed noise 111, sound period synthesized sound output unit 1 to be described later
3に出力する。 And outputs it to the 3. 本実施例では平均雑音パワースペクトル105を64の帯域(サブバンド)に分割し、サブバンドの1/2の帯域幅をもつガウス性雑音を、各サブバンドの中心周波数でAM変調し、別に求めた平均雑音パワースペクトル105のサブバンドのパワー値(サブバンド内の各平均雑音パワースペクトル値の和)の平方根より求められたサブバンドの振幅値を乗じてこの重畳雑音111を生成した。 In the present embodiment by dividing the average noise power spectrum 105 to 64 bands (sub-band), the Gaussian noise with a bandwidth of 1/2 of the sub-band, and AM modulation at the center frequency of each subband, obtains separately average noise power power value of the sub-band spectrum 105 by multiplying the amplitude value of the sub-band determined from the square root of (the mean sum of the noise power spectrum values ​​in the sub-band) generates the superimposed noise 111. これはハーモニックコーダーの無声音の合成方法と同様のものであり、例えば、H. Carl & This is similar to the method for synthesizing unvoiced harmonic coder, e.g., H. Carl &
B. Kolpatzik著、"Speech Coding Using Nonstationary B. Kolpatzik al., "Speech Coding Using Nonstationary
Sinusoidal Modelling and Narrow-Band Basis Functi Sinusoidal Modelling and Narrow-Band Basis Functi
ons",(IEEE Int. Conf. Rec. on ASSP(1991)pp581-584) ons ", (IEEE Int. Conf. Rec. on ASSP (1991) pp581-584)
に記載されている。 It is described in.

【0038】有音区間合成音出力手段13は、情報受信手段8で受信された有音/雑音判定情報102が有音フレームの場合、まず当該フレームの伝送スペクトル情報106、即ち雑音引き去りパワースペクトル104を用いて、ハーモニックコーダーの合成方法を用いて合成音を合成する。 The sound interval synthesized sound output unit 13, when speech / noise determination information 102 received by the information receiving means 8 of voice frames, first transmission spectrum information 106 of the frame, i.e. the noise subtraction power spectrum 104 It is used to synthesize the synthesized sound using the synthesis method of the harmonic coder. 具体的には、雑音引き去りパワースペクトル104を64のサブバンドに分割し、各サブバンドの中心周波数の正弦波に、サブバンドの振幅値を乗じて生成する。 Specifically, the noise subtraction power spectrum 104 is divided into 64 sub-bands, a sine wave of the center frequency of each subband, and generates by multiplying the amplitude value of the sub-band. 次に重畳雑音111に所定の重畳倍率(ここでは0.5)倍したものを重畳させ、出力合成音112として出力する。 Then a predetermined superimposed magnification superimposed noise 111 are superimposed those times (0.5 in this case) as the output synthesized sounds 112.

【0039】この例のように、スペクトルの引き去りに用いた、平均雑音パワースペクトルを用いて生成した雑音を、振幅を抑えて再度重畳させる構成をとることにより、引き去り誤差による、不連続な包絡ピークが埋め戻され、連続性が増し、聴覚的なマスク効果により、不快な雑音感を軽減する効果がある。 [0039] As in this example, was used in the subtraction of the spectrum, the noise generated using the average noise power spectrum by taking the structure to be superimposed again suppressed the amplitude, by subtraction errors, discrete envelope peak is backfilled, it increases the continuity, by the auditory masking effect, there is an effect to reduce the unpleasant feeling of noise.

【0040】図2は、実施例1の音声分析装置と音声合成装置による出力を、ハーモニックコーダーの前処理及び後処理に用いて符号化し復号した場合の合成音のスペクトル包絡の時間推移を説明する説明図である。 [0040] Figure 2, the output voice analyzer and speech synthesizer of the first embodiment, illustrating a time transition of the spectral envelope of the synthesized speech case of encoding decoded using the pre-treatment and post-treatment of the harmonic coder it is an explanatory diagram. 図2を観察すると、実施例1の音声分析装置と音声合成装置による出力を、前処理及び後処理に用いて符号化し復号した場合の合成音は、図15に見られたような小振幅の包絡ピークの時間的な不連続は、重畳した雑音によりマスクされている様子が分かる。 Upon examining Figure 2, the output voice analyzer and speech synthesizer of the first embodiment, the pretreatment and the synthesized speech in the case of encoded decoding using the post-processing, small amplitude as seen in FIG. 15 temporal discontinuity of the envelope peak is seen how the masked by the noise superimposed. また、図14、図15とそれに対する図2で示される合成音に対して、音声研究者6名により、音質の好ましさを基準とする簡単な対比較検査を行ったところ、選択率がそれぞれ10.7%,4 Further, FIG. 14, with respect to the synthesized speech represented by Figure 2 thereto and FIG. 15, the speech researchers six, in a simple pairwise comparison test relative to the desirability of sound quality, the selectivity 10.7%, respectively, 4
2.9%,96.4%となり、重畳雑音によるマスク効果が、聴覚上良好に機能していることが分かった。 2.9%, next 96.4%, the mask effect by the superposition noise was found to be audible on function well.

【0041】実施例2. [0041] Example 2. 本実施例では、送信側の雑音パワースペクトルとして平均ではなく、瞬時値を送る。 In this embodiment, instead of the average as the noise power spectrum of the transmission side sends an instantaneous value. 一方、受信側では、雑音区間ではこのまま受信値を合成して出力し、また有音区間では受信値を蓄積して平均雑音化して有音区間の加算源とする。 On the other hand, on the receiving side, in the noise interval and outputs the synthesized reception value as it is, also accumulates the received value and adding a source of average noise reduction to voiced section in the sound interval. 図3は、本実施例の音声分析装置と音声合成装置のブロック図である。 Figure 3 is a block diagram of a speech analysis apparatus and the speech synthesis device of the present embodiment. 図中新規な部分は、14の受信側平均雑音パワースペクトル算出手段である。 Figure in the novel parts are the recipient average noise power spectrum calculating means 14. その他の伝送スペクトル選択手段6、情報伝送手段7、情報受信手段8、重畳雑音合成手段1 Other transmission spectrum selecting unit 6, the information transmission means 7, the information receiving unit 8, superimposing the noise synthesizing means 1
1、有音区間合成音出力手段13は実施例1と同じであり、説明を省略する。 1, sound interval synthesized sound output unit 13 is the same as in Example 1, the description thereof is omitted. 平均雑音パワースペクトル算出手段14の構成は、送信側の平均雑音パワースペクトル算出手段5と似た構成で、バッファから平均算出手段にフィードバックループをかけ、平均化している。 Configuration of average noise power spectrum calculating unit 14, a configuration similar to the average noise power spectrum calculating means 5 of the transmitting side, multiplied by the feedback loop to the average calculating unit from the buffer, it is averaged.

【0042】以下、図3に示した実施例の構成の装置による動作について説明する。 [0042] Hereinafter, the operation by the apparatus of the configuration of the embodiment shown in FIG. 伝送スペクトル選択手段6 Transmission spectrum selection means 6
では、有音/雑音判定情報102が雑音フレームの場合、当該フレームのパワースペクトル103を選択し、 In the case voiced / noise determination information 102 of the noise frame, and select the power spectrum 103 of the frame,
伝送スペクトル情報106として出力する。 And outputs as a transmission spectrum information 106. 有音/雑音判定情報102が有音フレームの場合、雑音引き去りパワースペクトル情報104を選択し、出力する。 If speech / noise determination information 102 is voice frame, and select the noise subtraction power spectrum information 104, and outputs.

【0043】一方、情報受信手段8で受信された有音/ [0043] On the other hand, it is received by the information receiving means 8 the voice /
雑音判定情報102が雑音フレームの場合、受信側平均雑音パワースペクトル算出手段14は、バッファ内の過去の平均雑音パワースペクトル105、及び新たに受信された雑音フレームの伝送スペクトル情報106を用いて、平均雑音パワースペクトル105を算出し、バッファに出力する。 If noise determination information 102 of the noise frame, the receiving side average noise power spectrum calculating unit 14 uses the past average noise power spectrum 105 and transmission spectrum information 106 of the newly noise frame received, in the buffer, the mean calculating a noise power spectrum 105, and outputs to the buffer.

【0044】同時に当該雑音フレームの伝送スペクトル情報106、即ち当該雑音フレーム区間のパワースペクトル103を用いて、重畳雑音合成手段11において無音区間の合成音を合成し、その振幅を所定の減衰率(ここでは0.8)で減衰したものを、出力合成音112として出力する。 [0044] At the same time the transmission spectrum information 106 of the noise frame, that is, using the power spectrum 103 of the noise frame interval, by combining the synthesized sound of the silence section in superimposed noise synthesis unit 11, the amplitude a predetermined attenuation factor (here in those attenuated by 0.8) as the output synthesized sounds 112.

【0045】情報受信手段8で受信された有音/雑音判定情報102が有音フレームの場合、重畳雑音合成手段11は、平均雑音パワースペクトル105を用いて重畳雑音111を合成する。 [0045] When speech / noise determination information 102 received by the information receiving means 8 of voice frames, superimposing the noise synthesizing means 11 synthesizes the superimposed noise 111 using a mean noise power spectrum 105. また、有音区間合成音出力手段13は、当該フレームの伝送スペクトル情報106、即ち雑音引き去りパワースペクトル104を用いて、合成音を合成し、重畳雑音111に所定の重畳倍率(ここでは0.5)倍したものを重畳させ、出力音声112として出力する。 Also, the sound interval synthesized sound output unit 13, the transmission spectrum information 106 of the frame, i.e. by using a noise subtraction power spectrum 104, the synthesized sound synthesized, a predetermined superimposing magnification superimposed noise 111 (0.5 here ) multiplied by superimposed ones as the output speech 112.

【0046】この例のように、スペクトルの引き去りに用いた、平均雑音パワースペクトルから合成した合成音を再度重畳させる構成をとることにより、引き去り誤差による、不連続な包絡ピークが埋め戻され、連続性が増し、聴覚的なマスク効果により、不快な雑音感を軽減する効果がある。 [0046] As in this example, was used in the subtraction of the spectrum, by employing a configuration that superimposes a synthesized synthesis sound from average noise power spectrum again, by subtraction errors, discrete envelope peak backfilled, continuous sex is increased, by the auditory masking effect, there is an effect to reduce the unpleasant feeling of noise. また、雑音区間の出力音声を当該雑音フレームのスペクトルを用いて合成し、減衰して出力する構成にしたので、雑音区間の出力音声が自然かつ雑音が抑圧されるという効果がある。 Further, the output speech in a noise period synthesized using the spectrum of the noise frame, since the configuration and outputting the attenuated output sound of the noise interval there is an effect that natural and noise is suppressed.

【0047】実施例3. [0047] Example 3. 本実施例は、実施例2の受信側の雑音区間の出力を平均雑音パワースペクトルに基づいて合成し、出力するものである。 This embodiment is intended for the output of the noise section of the receiving side of example 2 was synthesized on the basis of the average noise power spectrum, and outputs. 図4は、本実施例の音声分析装置と音声合成装置のブロック図である。 Figure 4 is a block diagram of a speech analysis apparatus and the speech synthesis device of the present embodiment. 図中、 In the figure,
音声分析装置と、音声合成装置中の有音区間の出力合成音112は実施例2と同じであり、説明を省略する。 Omitted and voice analyzer, the output synthesized sounds 112 of the voiced interval in the speech synthesis apparatus is the same as in Example 2, the description.

【0048】以下、本実施例の構成の装置による動作について説明する。 [0048] Hereinafter, the operation by the device structure of the present embodiment. 情報受信手段8で受信された有音/雑音判定情報102が雑音フレームの場合、重畳雑音合成手段11は、平均雑音パワースペクトル105を用いて重畳雑音111を合成し、重畳雑音111の振幅を所定の減衰率(ここでは0.8)で減衰したものを、出力合成音112として出力する。 If speech / noise determination information 102 received by the information receiving means 8 of the noise frame, superimposed noise synthesis unit 11 uses the average noise power spectrum 105 synthesizes the superimposed noise 111, a predetermined amplitude of the superimposed noise 111 the attenuation factor (here 0.8) for outputting those attenuated, as the output synthesized speech 112.

【0049】この例のように、スペクトルの引き去りに用いた、平均雑音パワースペクトルを用いて生成した雑音を再度重畳させる構成をとることにより、引き去り誤差による、不連続な包絡ピークが埋め戻され、連続性が増し、聴覚的なマスク効果により、不快な雑音感を軽減する効果がある。 [0049] As in this example, was used in the subtraction of the spectrum, by employing a configuration that superimposes the noise generated by using the average noise power spectrum again, by subtraction errors, discrete envelope peak backfilled, continuity is increased, by the auditory masking effect, there is an effect to reduce the unpleasant feeling of noise. また、雑音区間の出力音声を平均雑音パワースペクトルを用いて合成し、減衰して出力する構成にしたので、雑音区間の出力音声が平滑化され、雑音が抑圧されるという効果がある。 Further, the output speech in a noise period was synthesized by using an average noise power spectrum, since the configuration and outputting the attenuated output sound of the noise period is smoothed, there is an effect that noise is suppressed.

【0050】実施例4. [0050] Example 4. 上記実施例2及び3の構成を合わせ持ち、受信側での雑音フレーム区間に対する出力音声の作成手段を、使用者が選択できるようにすることも、もちろん可能である。 Have combined configuration of the above Examples 2 and 3, a creation means outputs the speech to noise frame section of the receiving side, it is of course also possible to allow a user to select. この例のように、雑音区間の出力音声の作成手段を、利用者が選択可能な構成とする事により、出力される雑音の性質、程度によって、より聴取しやすい方式を自由に選択できるという効果がある。 Effect as in this example, the output sound creation means noise section, by a selectable configuration user, the nature of the outputted noise, the degree, free to choose more listening easy manner there is.

【0051】実施例5. [0051] Example 5. 上記実施例1乃至4では、情報伝送手段7及び情報受信手段8を用いて、有音/雑音判定情報12及び伝送スペクトル情報16の受け渡しを行っていたが、これらの伝送情報を、公知の音声符号化/ In Embodiment 1 to 4, using the information transmitting means 7 and the information receiving unit 8, had been passing speech / noise determination information 12 and the transmission spectrum information 16, these transmission information, known speech Coding/
復号化手段のパラメータの一部として伝送する構成も可能である。 Configured to transmit as part of the parameters of the decoding means is also possible. 上記実施例1乃至4は、音声の符号化/復号化処理とは独立した構成であるので、蓄積、伝送を目的とする音声符号化/復号化方式と自由に組み合わせができる利点がある。 Examples 1 to 4, since it is independent configuration from the encoding / decoding of speech, accumulation, there is the advantage that can be freely combined with the speech coding / decoding scheme for the purpose of transmission.

【0052】実施例6. [0052] Example 6. 本実施例は、音声合成装置の有音区間での雑音重畳に際し、更にきめ細かく有音と雑音のパワースペクトルの平均で重畳倍率を変えようとする例を説明する。 This example, when noisy in voiced sections of the speech synthesizer, an example of trying to change the superposition magnification further in average granular sound and noise power spectrum. 図5は、本実施例の音声合成装置のブロック図の内、重畳倍率制御手段16の動作を説明する構成図である。 5, of the block diagram of the speech synthesis device of the present embodiment is a configuration diagram illustrating the operation of the superposition ratio control means 16. 図中新規な部分は、16の重畳倍率制御手段、また、16aは重畳倍率算出手段、16bは雑音パワースペクトル平均算出手段、16cは有音パワースペクトル平均算出手段である。 Drawing the novel parts, 16 of the superposition ratio control means also,, 16a is superimposed magnification calculating means, 16b is noise power spectrum averaging means, 16c is voiced power spectrum averaging means. また、116は重畳倍率である。 Also, 116 is a superposition ratio. 情報受信手段8、平均雑音パワースペクトル保持手段9、重畳雑音合成手段11、有音区間合成音出力手段13は実施例1と同じであるので説明を省略する。 Information receiving means 8, the average noise power spectrum holding means 9, superimposing the noise combining means 11, since speech interval synthesized sound output unit 13 is the same as in Example 1 omitted.

【0053】以下、図5を用いて、実施例6の重畳倍率制御手段16の動作の説明を行う。 [0053] Hereinafter, with reference to FIG. 5, a description of the operation of superimposition ratio control means 16 of the sixth embodiment. 重畳倍率制御手段1 Superimposing magnification control means 1
6は、有音/雑音判定情報102に従い、雑音区間合成音出力手段12及び有音区間合成音出力手段13からの出力合成音112について、有音及び雑音区間それぞれの、前フレームまでの全てのフレームの合成音の平均信号パワーを算出する。 6, in accordance with speech / noise determination information 102, the output synthesized sounds 112 from the noise section synthesized sound output unit 12 and the sound interval synthesized sound output unit 13, respectively voiced and noise section, all up to the previous frame calculating the average signal power of a frame of synthesized speech. そして、雑音区間の平均信号パワーに対する有音区間の平均信号パワーの比を計算し、これをもとに重畳倍率116を出力する。 Then, the ratio of the average signal power of the sound period to the average signal power in a noise period is calculated, and outputs the superimposed magnification 116 it to the original. 有音区間合成音出力手段13では、重畳倍率116に従い、雑音引き去りパワースペクトル104から合成された合成音に重畳雑音111の重畳を行い、出力音声112を出力する。 In sound interval synthesized sound output unit 13, in accordance with superposition magnification 116, the synthetic sound synthesized from the noise subtraction power spectrum 104 performs superposition of the superposition noise 111, and outputs an output audio 112.
ここで重畳倍率116の決定は、例えば平均信号パワーの比が小さいときには、重畳倍率を大きくするように、 Wherein determining the superimposition ratio 116, for example, when the ratio of the average signal power is small, so as to increase the superposition ratio,
逆に平均信号パワーの比が大きいときには、重畳倍率を小さくするようにすればよい。 When a large ratio of the average signal power is reversed, it is sufficient to reduce the superposition ratio.

【0054】このように有音及び雑音区間それぞれの、 [0054] of each this way, sound and noise section,
合成音の平均信号パワーの比によって重畳倍率を制御する構成にしたことにより、背景雑音レベルに応じた雑音重畳が可能となる点で効果がある。 By having a configuration to control the superimposed magnification by the ratio of the average signal power of the synthesized speech, it is effective in that it becomes possible noisy corresponding to the background noise level.

【0055】実施例7. [0055] Example 7. 上記実施例6では重畳倍率11 Example 6 above the superposition ratio 11
6を、前フレームまでの有音/雑音フレームのそれぞれの総平均信号パワー比で決定していたが、例えば現フレームまでの総平均の比、あるいは、過去5フレームのみの平均の比等、任意の区間の平均を用いて計算させる構成ももちろん可能である。 6, had been determined for each total average signal power ratio of the speech / noise frame to the previous frame, for example, the ratio of the average to the current frame or the ratio or the like of the average of only the past five frames, optionally configured to calculate using the average of the period it is of course also possible. このように、重畳倍率制御信号116の決定に用いるフレーム区間を任意に取れる構成にすることにより、話者の使用環境に応じた適切な重畳倍率の制御が可能になるという効果がある。 Thus, by arbitrarily take up a frame period used to determine the superimposition ratio control signal 116, there is an effect that it becomes possible to control the proper superposition ratio corresponding to the speaker environment.

【0056】実施例8. [0056] Example 8. 本実施例は、有音区間での雑音スペクトルの加算に際し、音声信号、雑音とともに周波数帯域別に区分して、その区分毎に重畳倍率を変えて重畳しようとするものである。 This example, upon addition of the noise spectrum in the sound period, the audio signal, by dividing for each frequency band with noise, it is intended to superimpose change the superimposed magnifications for respective segment. 図6は、本実施例の音声合成装置のブロック図の内、帯域別重畳倍率制御手段17 6, of the block diagram of the speech synthesis device of the present embodiment, the band-by-band superposition ratio control means 17
を主に記載し、その動作を説明する図である。 The mainly described, is a diagram for explaining the operation thereof. 図中新規な部分は、17の帯域別重畳倍率制御手段、17a〜1 Drawing the novel parts, 17 per-band superposition ratio control means, 17A~1
7dは、平均パワースペクトル算出手段、17e,17 7d, the average power spectrum calculating means, 17e, 17
fは、帯域分離のための理想的なB. f is ideal B. for the band separation P. P. F(バンド・ F (band
パス・フィルタ)である。 The path is a filter). また、有音区間合成音出力手段13中の有音合成手段13a、重畳手段13bの他に、13c〜13fの理想的なB. Also, sound synthesizing means 13a in the sound period synthesized sound output unit 13, in addition to the superposition means 13b, ideal B. of 13c~13f P. P. F、13g〜1 F, 13g~1
3jの重畳手段がある。 There is superimposed means 3j. また、117の帯域別重畳倍率がある。 Further, there is a per-band superposition ratio of 117. 他の構成要素は既に述べた実施例のものと同様である。 Other components are already similar to those of the embodiment described.

【0057】以下、図6を用いて、実施例8の帯域別重畳倍率制御手段17の動作の説明を行う。 [0057] Hereinafter, with reference to FIG. 6, a description of the operation of the per-band superposition ratio control means 17 of the eighth embodiment. 帯域別重畳倍率制御手段17は、有音/雑音判定情報102に従い、 Band by superimposing ratio control means 17 in accordance with voice / noise determination information 102,
伝送スペクトル情報106、即ち有音フレームの場合には雑音引き去りパワースペクトル、雑音フレームの場合には平均雑音パワースペクトルを取り込み、各帯域毎に平均信号パワーの比を計算し、これをもとに帯域別重畳倍率117を出力する。 Transmission spectral information 106, i.e., the noise subtraction power spectrum in the case of voice frames, in the case of the noise frame takes the average noise power spectrum, calculates the ratio of the average signal power in each band, the band on the basis of this It outputs a different superposition magnification 117. 有音区間合成音出力手段13では、帯域別重畳倍率117に従い、雑音引き去りパワースペクトル104から合成された合成音に重畳雑音11 In sound interval synthesized sound output unit 13, in accordance with the band-by-band superimposed magnification 117, superimposed noise synthetic sounds synthesized from the noise subtraction power spectrum 104 11
1の重畳を、帯域別に行い、出力音声112を出力する。 1 of the superposition carried out by band, and outputs an output audio 112. 帯域の分割数はここでは5とした。 The division number of bands was 5 here. このとき帯域別重畳倍率117は、各帯域の平均パワー比が小さい時、 When this time zone by superimposing magnification 117 has a smaller average power ratio of each band,
即ち平均パワー比に差がない時には大きく、逆に比が大きいとき、小さくなるように設定すればよい。 That large when there is no difference in average power ratio, when the ratio conversely large, may be set smaller. このように重畳倍率を帯域別に制御する構成にしたことにより、 By having a configuration to control such overlaps factor by band,
ある特定の帯域にパワーの集中した背景雑音に対しても効果的な重畳制御が可能となる効果がある。 There are also enables effective superposition control effect on concentrated background noise power in a particular band.

【0058】実施例9. [0058] Example 9. 上記実施例6乃至8を組み合わせて用いることももちろん可能である。 It is of course possible to use a combination of the above Examples 6-8. フレーム内の全帯域の平均信号パワーと帯域別の平均信号パワーの両方を考慮にいれて重畳倍率を制御する構成にすることで、 By the configuration is taking into account both the average signal power and the per-band average signal power of the whole band in a frame for controlling the superimposing magnification,
より安定した重畳効果が得られるという利点がある。 There is an advantage that more stable superposition effect.

【0059】実施例10. [0059] Example 10. 上記実施例8乃至9の帯域別重畳倍率制御手段17における、帯域別重畳倍率117 In the band by superimposing ratio control means 17 of the above Examples 8-9, the band-by-band superimposed magnification 117
の算出の際に、帯域別のバイアスを与えることも可能である。 During the calculation, it is also possible to provide a per-band bias. 例えば低域は重畳倍率を小さめに、高域ほど重畳倍率を大きめに算出するという構成も可能である。 For example low frequency to be smaller the superimposed magnification configurations are possible that larger calculate the superposition ratio higher the frequency. このような構成を取ることにより、一般に推定誤差が大きい高域の雑音に対するマスク効果が得られるという利点がある。 By adopting such a configuration, there is an advantage that the mask effect for general estimation error is large high-frequency noise can be obtained.

【0060】実施例11. [0060] Example 11. 本実施例は、音声分析装置側での雑音引き去りパワースペクトル生成の工夫をした例を説明する。 This example describes an example in which the twist of the power spectrum generated subtraction noise at the sound analysis apparatus. 即ち実施例6の雑音重畳のための構成を、 That structure for noisy Example 6,
送信側の雑音引き去り部分に適用する。 Applied to the noise subtraction part of the sender. 図7は、請求項7の発明の音声分析装置の一構成例を示すブロック図である。 Figure 7 is a block diagram showing a configuration example of a sound analysis device of the invention of claim 7. 図中新規な部分は、19の信号強度比による引き去り率算出手段、更に、詳細には19aの有音平均パワースペクトル算出手段、19bの平均雑音パワースペクトル算出手段、19cのパワー比較手段がある。 Drawing the novel parts, subtraction rate calculation means by the signal intensity ratio of 19, further, in particular voice average power spectrum calculating means 19a, the average noise power spectrum calculating means 19b, there is a power comparator means 19c. また、 Also,
118はスペクトル引き去り率である。 118 is a spectral subtraction rate. その他の構成要素は、他の実施例と同じであるので説明を省略する。 Other components will be omitted because it is same as the other embodiments.

【0061】以下、図7を用いて本構成の音声分析装置の動作について説明する。 [0061] The operation of the sound analysis device of this configuration will be described with reference to FIG. 信号強度比による引き去り率算出手段19は、音声信号101、有音/雑音判定情報102を入力とし、有音/雑音判定情報102を用いて、有音区間及び雑音区間のそれぞれの平均信号パワー比を求め、それを用いてスペクトル引き去り率118を算出し、出力する。 Subtraction calculating unit 19 by the signal intensity ratio, the audio signal 101 as input speech / noise determination information 102, using a speech / noise determination information 102, each of the average signal power ratio of the voiced section and noise section the calculated, to calculate the spectral subtraction factor 118 and used to output. このとき例えば平均信号パワー比が小さい時、即ち平均信号パワー比に差がない時には大きく、逆に比が大きいとき、即ち雑音区間の平均信号パワーが、有音区間のそれに比べ小さいときには、小さく設定する。 When this time for example, an average signal power ratio is small, i.e., large when there is no difference in average signal power ratio, when the ratio conversely large, i.e. the average signal power of the noise interval, when smaller than that of voiced section is set smaller to.

【0062】スペクトル減算手段4において、当該フレームのパワースペクトル103より、前記信号強度比による引き去り率算出手段19で得られたスペクトル引き去り率118に従って、平均雑音パワースペクトル10 [0062] In spectral subtraction unit 4, from the power spectrum 103 of the frame, according to the spectral subtraction rate 118 obtained in subtraction calculating unit 19 by the signal intensity ratio, average noise power spectrum 10
5の引き去りを行い、雑音引き去りパワースペクトル1 5 performs a subtraction of the noise subtraction power spectrum 1
04を出力する。 And it outputs a 04. このように有音区間及び雑音区間のそれぞれの平均信号パワー比を求め、それを用いてスペクトル引き去り率118を算出する構成にしたことにより、背景雑音レベルに応じた引き去りが可能になるという利点がある。 Thus determined respective average signal power ratio of the voiced section and the noise section, by which a configuration to calculate the spectral subtraction factor 118 therewith, the advantage to allow subtraction corresponding to the background noise level is there.

【0063】実施例12. [0063] Example 12. 本実施例は、実施例8で示した、帯域別の重畳倍率制御を、送信側の引き去りに適用した例である。 This embodiment is shown in Example 8, the per-band superposition ratio control, an example of application to a subtraction of the sender. 即ち、雑音の引き去り率を帯域別に変えようとするものである。 In other words, it is intended to change the subtraction of the noise for each band. 図8は、請求項8の発明の音声分析装置の一実施例のブロック図である。 Figure 8 is a block diagram of an embodiment of a sound analysis device of the invention of claim 8. 図中新規な部分は、帯域別引き去り率算出手段20、更に詳細には2 Drawing the novel parts, per-band subtraction rate calculating means 20, the more 2
0a〜20fの帯域分割手段のB. B. of the band division means of 0a~20f P. P. F、20g〜2 F, 20g~2
0lの平均パワースペクトル算出手段、20m〜20p The average power spectrum calculating means 0l, 20m~20p
の引き去り算出手段、20q〜20vの引き去り手段、 Subtraction calculation means, of 20q~20v subtraction means,
20wの出力スペクトル再生成手段がある。 There is an output spectrum regeneration unit of 20 w. また、11 In addition, 11
8はスペクトル引き去り率である。 8 is a spectral subtraction rate. その他の構成要素は他の実施例と同じであるので説明を省略する。 Other components will be omitted because it is same as the other embodiments.

【0064】以下、図8を用いて請求項8の構成の装置の動作について説明する。 [0064] The operation of the configuration of the apparatus according to claim 8 will be described with reference to FIG. 帯域別引き去り率算出手段2 Band by subtraction calculating unit 2
0は、有音/雑音判定情報102、当該フレームのパワースペクトル103、及び平均雑音パワースペクトル1 0, speech / noise determination information 102, the power spectrum 103 of the frame, and the average noise power spectrum 1
05をいくつかの帯域に分割する。 05 is divided into several bands. 具体的には、パワースペクトルの当該帯域区間を選択し、その区間のパワースペクトル値のみ処理対象とする、理想的なバンドパスフィルタを用いる。 Specifically, to select the band section of the power spectrum, it is processed only the power spectrum value of the section, using the ideal bandpass filter. ここでは分割数を5とした。 Here was set to 5 the number of divisions. 次に、 next,
それぞれの帯域の有音区間と雑音区間の平均パワーの比を平均パワースペクトル算出手段20g〜20lで求め、これをもとに帯域別の引き去り率を引き去り率算出手段20m〜20pで決定し、スペクトル引き去り率を出力する。 The ratio of the average power of each band voiced segment and a noise section determined by the average power spectrum calculating means 20G~20l, which was determined by subtraction rate calculating means 20m~20p per-band subtraction rate based on the spectral and outputs the subtraction rate. このとき各引き去り率は例えば平均パワー比が小さい時、即ち平均パワー比に差がない時には大きく、逆に比が大きいとき、即ち平均雑音パワースペクトル105の当該帯域の平均パワーが、当該フレームのパワースペクトル103のそれに比べ小さいときには、小さく設定する。 When the subtraction factor this time is small for example, the average power ratio, i.e. large when there is no difference in average power ratio, when the ratio conversely large, i.e. the average power of the band of average noise power spectrum 105, the power of the frame when smaller than that of the spectrum 103 is set small.

【0065】スペクトル減算手段4において、各帯域の当該フレームのパワースペクトル103より、前記帯域別引き去り率算出手段20で得られたスペクトル引き去り率118に従って、平均雑音パワースペクトル105 [0065] In spectral subtraction unit 4, from the power spectrum 103 of the frame of each band, according to the spectral subtraction rate 118 obtained in the band-by-band subtraction calculating unit 20, average noise power spectrum 105
の引き去りを行い、次に、出力スペクトル再生成手段2 Performs subtraction of the then output spectrum regeneration unit 2
0wで各帯域を取りまとめ、雑音引き去りパワースペクトル104を出力する。 Compilation of each band in 0w, and outputs the noise subtraction power spectrum 104.

【0066】このようにスペクトル引き去り率を帯域別に制御する構成にしたことにより、ある特定の帯域にパワーの集中した背景雑音に対しても効果的な引き去りが可能となる効果がある。 [0066] By having a configuration for controlling the way the spectral subtraction factor by band, there is an effect that effective subtraction against concentrated background noise power in a particular band is possible. 図9は、3つの帯域に区分して異なる引き去り率で引き去りパワースペクトルを得る例を示した図である。 Figure 9 is a diagram showing an example of obtaining a power spectrum subtraction in different subtraction rate and divided into three bands. 帯域の区切りで不連続になるが、実用上は全く問題はなく、効果的な雑音除去ができる。 It becomes discontinuous at separator band, practically no problem at all, can be effectively denoising.

【0067】実施例13. [0067] Example 13. 上記実施例12では、帯域毎の引き去り率を独立に算出する構成になっていたが、帯域毎の引き去り率にバイアスをもたせることも可能である。 In Embodiment 12, had become configured to calculate a subtraction rate for each band independently, it is also possible to have a bias to the subtraction factor for each band. 例えば低域は引き去り率を小さめに、高域ほど引き去り率を大きめに算出するという構成も可能である。 For example low frequency to be smaller the rate subtraction, configuration is also possible that larger calculate the subtraction factor the higher frequency. このように引き去りに帯域別のバイアスをもたせた構成にすることにより、聴感上好ましい雑音抑圧効果が得られるように調整しておけるという利点がある。 By the configuration remembering the per-band bias subtraction Thus, there is an advantage that Okeru adjusted to perceptually preferable noise suppression effect can be obtained.

【0068】実施例14. [0068] Example 14. 上記実施例12乃至13では、帯域別引き去り率算出手段20を単独で用いていたが、実施例11の信号強度比による引き去り率算出手段19を組み合わせる構成も可能である。 In Embodiment 12 to 13, but the band-by-band subtraction rate calculating means 20 was used alone, it is also possible to adopt a composition combining the subtraction calculating unit 19 by the signal intensity ratio of Example 11. この際、スペクトル引き去り率118は、全帯域に対する平均的な引き去り率を信号強度比による引き去り率算出手段19で算出しておき、引き続き帯域別引き去り率算出手段20で個別帯域の調整を行う構成とすることが考えられる。 In this case, the spectral subtraction factor 118, a configuration in which an average subtraction rate previously calculated by the subtraction calculating unit 19 by the signal intensity ratio is continually adjusted for individual bands by the band-by-band subtraction rate calculating means 20 for the whole band it is conceivable to. このようにフレーム内の全帯域の平均信号パワーと帯域別の平均信号パワーの両方を考慮にいれて引き去り率を制御する構成にすることで、より安定した引き去り効果が得られるという利点がある。 With a configuration of this control the whole band average signal power and subtraction factor is taken into account both the per-band average signal power in the frame, there is an advantage that more stable subtraction effect can be obtained.

【0069】実施例15. [0069] Example 15. 図10は、請求項9の発明の音声分析装置の一実施例のブロック図である。 Figure 10 is a block diagram of an embodiment of a sound analysis device of the invention of claim 9. 図10の構成において、帯域別引き去り率算出手段20中に、2 In the configuration of FIG. 10, in the band-by-band subtraction rate calculating means 20, 2
0x〜20zのリミッタが設けられている。 Limiter of 0x~20z is provided. 他の構成要素は、実施例14の図8で示す要素と同じである。 Other components are the same as elements shown in Figure 8 of Example 14.

【0070】以下、図10を用いて請求項9の音声分析装置の一実施例の動作について説明する。 [0070] Hereinafter, the operation of one embodiment of a speech analysis apparatus according to claim 9 will be described with reference to FIG. 10. 引き去り率算出手段18は、有音/雑音判定情報102、当該フレームのパワースペクトル103、及び平均雑音パワースペクトル105とから、スペクトル引き去り率118を算出し、出力する。 Subtraction calculating unit 18, speech / noise determination information 102, from the power spectrum 103, and the average noise power spectrum 105. of the frame, to calculate the spectrum subtraction ratio 118, and outputs. スペクトル減算手段4において、当該フレームのパワースペクトル103より、前記引き去り率算出手段18で得られたスペクトル引き去り率118 In spectral subtraction unit 4, from the power spectrum 103 of the frame, the spectral subtraction rate obtained by the subtraction calculating unit 18 118
に従って、平均雑音パワースペクトル105の引き去りを行い、雑音引き去りパワースペクトル104を出力する。 Accordance performs subtraction of the average noise power spectrum 105, and outputs the noise subtraction power spectrum 104. 20x〜20zのリミッタにより、予め定めたしきい値以下では引き去りが行われず、このリミッタ設定のしきい値が出力される。 The 20x~20z limiter, not performed subtraction is less than a predetermined threshold value, the threshold value of the limiter setting is output.

【0071】実施例16. [0071] Example 16. 上記実施例では、リミッタを用いて引き去り振幅制限をした。 In the above embodiment, and the amplitude limiting subtraction using a limiter. しかし、本実施例では、図8の構成で雑音引き去りパワースペクトル104 However, in this embodiment, the power spectrum 104 subtraction noise in the configuration of FIG. 8
を引き去り率算出手段20m〜20pフィードバックし、再計算をしてもよい。 The subtraction rate calculating means 20m~20p feedback may be recalculated. 即ち、引き去り率算出手段2 In other words, subtraction rate calculation means 2
0m〜20pでは、雑音引き去りパワースペクトル10 In 0m~20p, noise subtraction power spectrum 10
4の振幅成分の最小値を検出し、その値が予め定められている値以下の場合には、再度当該フレームのパワースペクトル103、及び平均雑音パワースペクトル105 4 detects a minimum value of the amplitude component, when: the value whose value is predetermined, the power spectrum 103 of the frame again, and the average noise power spectrum 105
とからスペクトル引き去り率118の値を修正算出する。 Modifying calculate the value of the spectral subtraction factor 118 and a. この処理を雑音引き去りパワースペクトル104の振幅成分の最小値が所定の値以内に納まるまで繰り返す。 The minimum value of the amplitude component of the power spectrum 104 subtraction noise this process is repeated until fall within a predetermined value.

【0072】このように雑音引き去りパワースペクトル104の振幅成分の最小値を検出し、その値が予め定められている値以下の場合には、再度スペクトル引き去り率118の値を修正算出する構成とすることにより、引き去り誤差を最小限にとどめる引き去り処理が可能となる効果がある。 [0072] In this way detects a minimum value of the amplitude component of the noise subtraction power spectrum 104, in the case of less than or equal to the value whose value is predetermined is configured to calculate corrected values ​​of the spectral subtraction factor 118 again it leads to an effect that it is possible to subtraction processing minimize error subtraction.

【0073】実施例17. [0073] Example 17. 上記実施例では、音声分析装置と音声合成装置を別々の説明してきた。 In the above embodiment has been described separate audio analyzer and speech synthesizer. これらを併せた音声伝送システムが実用上は有用である。 Voice transmission system is practical in conjunction these are useful. 即ち、図1 That is, FIG. 1
に示す基本的な構成要素を備えた音声分析装置と、同じく図1に示す基本的な構成要素を備えた音声合成装置とで構成される音声伝送システムである。 A voice analysis device with basic components shown in, which is also a voice transmission system composed of the speech synthesizer with basic components shown in FIG. この場合、複数の音声合成装置があるいわゆる、放送形式のシステムであってもよいし、逆に音声分析装置が複数あって受信側は切換使用するシステムであってもよい。 In this case, a so-called have multiple voice synthesizer, may be a system broadcast format, the receiving side speech analysis device is a plurality of the inverse may be a system for switching and using.

【0074】このような構成を取ることにより、引き去り誤差の小さな雑音引き去りパワースペクトルを伝送する事ができ、かつ重畳によるマスク効果も得られる効果がある。 [0074] By adopting such a configuration, subtraction small noise subtraction power spectrum of the error can be transmitted to, and there is a masking effect is also obtained the effect of superposition.

【0075】実施例18. [0075] Example 18. 上記実施例17では、有音区間合成音出力手段13で用いる重畳倍率は固定としたが、これをフレーム毎に可変とし、引き去り率算出手段18でもとめたスペクトル引き去り率118を、情報伝送手段7、伝送路200、情報受信手段8を通じて伝送し、重畳倍率の算出に用いる構成も可能である。 In Embodiment 17, although superimposed magnification used in the sound period synthesized sound output unit 13 is fixed, which is variable for each frame, the spectral subtraction rate 118 parked even subtraction calculating unit 18, the information transmission means 7 , the transmission path 200, and transmitted via the information receiving means 8, it is also possible to use in the calculation of the superposition ratio. また、 Also,
実施例6乃至10の重畳倍率制御手段を組み合わせることももちろん可能である。 It is of course also possible to combine superimposing magnification control means Example 6-10. この構成を取ることにより、 By adopting this configuration,
重畳によるマスク効果が適正な範囲で制御できる効果がある。 Masking effect due to superposition is effective that can be controlled by appropriate range.

【0076】 [0076]

【発明の効果】この発明による雑音抑圧音声分析装置は、 雑音引き去りパワースペクトルと、雑音スペクトル Effects of the Invention noise reduced speech analyzer according to the present invention, a noise subtraction power spectrum, the noise spectrum
を選択して送信するようにしたので、受信側に自然な合 Since so as to selectively sends, natural if the receiving side
成音を生成するための信号を与えることができるという That can provide a signal for generating the Naruoto
効果がある。 effective.

【0077】 [0077]

【0078】更にまた音声分析装置は、有音区間では雑音引き去りパワースペクトルを、雑音区間では雑音フレームのスペクトルを伝送するようにしたので、受信側に対し区間ごとに更に不快な雑音感を軽減できる効果がある。 [0078] Furthermore the voice analyzer, the noise subtraction power spectrum is voiced section, since in the noise section is so as to transmit a spectrum of the noise frame can be further alleviated unpleasant feeling of noise for each section to the receiving side effective.

【0079】 [0079]

【0080】更にまた音声合成装置は、音声信号と、雑音スペクトルを倍率を掛けて重畳するようにしたので、 [0080] Furthermore speech synthesizer, an audio signal, since the noise spectrum so as to superimpose over the magnification,
更にきめ細かな合成音が得られる効果がある。 The effect of further fine synthesized sound can be obtained.

【0081】更にまた音声合成装置は、帯域ごとに音声信号と、雑音スペクトルを倍率を掛けて重畳するようにしたので、更にきめ細かな聞き取りやすい合成音が得られる効果がある。 [0081] Furthermore speech synthesizer, and the audio signal for each band, since the noise spectrum so as to superimpose over the magnification, the effect of further fine easily audible synthesized speech is obtained.

【0082】更にまた音声分析装置は、音声信号から雑音スペクトルを倍率を掛けて引き去るようにしたので、 [0082] Furthermore the sound analysis device, since the noise spectrum from the audio signal to subtract by multiplying the magnification,
受信側に対し自然な雑音引き去りパワースペクトルを送れる効果がある。 There is an effect that live a natural noise subtraction power spectrum with respect to the receiving side.

【0083】更にまた音声分析装置は、帯域ごとに、音声信号から雑音スペクトルを倍率を掛けて引き去るようにしたので、受信側に対し更に自然な雑音引き去りパワースペクトルを送れる効果がある。 [0083] Furthermore the sound analysis device, for each band. Thus subtracted by multiplying the magnification of noise spectrum from the speech signal, further the effect of live a natural noise subtraction power spectrum with respect to the receiving side.

【0084】更にまた音声分析装置は、音声信号から雑音スペクトルを倍率を掛けて引き去る際にしきい値を設けて引き過ぎ防いだので、受信側に対し更に自然な雑音引き去りパワースペクトルを送れる効果がある。 [0084] Furthermore the sound analysis device, since prevented pulled too far provided threshold when subtracted by multiplying the magnification of noise spectrum from the speech signal, the effect of live a more natural noise subtraction power spectrum to the receiving side is there.

【0085】この発明による音声伝送システムは、雑音スペクトルも送るようにした音声分析装置と、雑音引き去りスペクトルに雑音スペクトルからの合成音を重畳して有声区間の合成音を生成する音声合成装置で構成したので、自然な合成音が伝送できる効果がある。 [0085] voice transmission system according to the invention, consists of a speech synthesizer for generating a speech analysis apparatus that sends also the noise spectrum, the noise subtraction synthesized sound superposition to voiced synthesized speech from noise spectrum to the spectrum since the, there is an effect that can be transmitted is natural synthesized sound.

【0086】更にまた音声伝送システムは、雑音の引き去り率を可変にして雑音引き去りパワースペクトルを送るようにした音声分析装置と、雑音引き去りスペクトルに雑音スペクトルからの合成音を重畳倍率を可変にして重畳して有声区間の合成音を生成する音声合成装置で構成したので、更に自然な合成音が伝送できる効果がある。 [0086] Furthermore speech transmission system, and a voice analyzer to send noise subtraction power spectrum by the subtraction rate of the noise in the variable, the noise subtraction spectrum superposition magnification synthesized speech from the noise spectrum in the variable superimposition since it is configured with voice synthesizer for generating a synthesized sound of the voiced intervals and there is an effect that can transmit more natural synthesized sound.

【図面の簡単な説明】 BRIEF DESCRIPTION OF THE DRAWINGS

【図1】本発明の実施例1の雑音抑圧音声分析装置と雑音抑圧音声合成装置の構成図である。 1 is a configuration diagram of a noise reduced speech analyzer and noise reduced speech synthesis apparatus of the first embodiment of the present invention.

【図2】本発明の実施例の音声分析装置と音声合成装置による出力信号を時間推移軸で表した図である。 2 is a diagram showing an output signal in the time transition axis voice analyzer and speech synthesizer of the embodiment of the present invention.

【図3】本発明の実施例2の雑音抑圧音声分析装置と雑音抑圧音声合成装置の構成図である。 3 is a block diagram of a noise reduced speech analyzer and noise reduced speech synthesizing apparatus according to a second embodiment of the present invention.

【図4】本発明の実施例3の雑音抑圧音声分析装置と雑音抑圧音声合成装置の構成図である。 4 is a block diagram of a noise reduced speech analyzer and noise reduced speech synthesizing apparatus according to a third embodiment of the present invention.

【図5】本発明の実施例6の装置中の重畳倍率制御手段の詳細構成図である。 5 is a detailed block diagram of a superimposing ratio control means in the apparatus of Example 6 of the present invention.

【図6】本発明の実施例8の装置中の帯域別重畳倍率制御手段の詳細構成図である。 6 is a detailed block diagram of a band-by-band superposition ratio control means in the apparatus of Example 8 of the present invention.

【図7】本発明の実施例11の音声分析装置の構成図である。 7 is a block diagram of a sound analysis device of Example 11 of the present invention.

【図8】本発明の実施例12の音声分析装置の構成図である。 8 is a block diagram of a sound analysis device of Example 12 of the present invention.

【図9】帯域別雑音引き去りスペクトルを説明する図である。 FIG. 9 is a diagram illustrating a band-by-band noise subtraction spectrum.

【図10】本発明の実施例15の音声分析装置の構成図である。 It is a block diagram of a sound analysis device of Example 15 of the present invention; FIG.

【図11】従来の雑音処理装置の構成図である。 11 is a configuration diagram of a conventional noise reduction apparatus.

【図12】原音声信号のスペクトル包絡の時間推移を説明する図である。 12 is a diagram for explaining a time transition of the spectral envelope of the original audio signal.

【図13】原音声信号に白色雑音を重畳させた信号のスペクトル包絡の時間推移を説明する図である。 13 is a diagram illustrating the time course of the spectral envelope of the signal obtained by superimposing white noise to the original audio signal.

【図14】図13の信号を符号化/復号化した合成音信号のスペクトル包絡の時間推移を説明する図である。 14 is a diagram illustrating the time course of the spectral envelope of the signal in FIG. 13 encoding / decoding the synthesized sound signal.

【図15】図13の信号を従来の雑音処理装置で処理した音声を符号化/復号化した合成音信号のスペクトル包絡の時間推移を説明する図である。 15 is a diagram illustrating the time course of the spectral envelope of the speech treated with conventional noise processor signals of FIG. 13 encoding / decoding the synthesized sound signal.

【符号の説明】 DESCRIPTION OF SYMBOLS

2 有音/雑音判定手段 3 スペクトル分析手段 4 スペクトル減算手段 5 平均雑音パワースペクトル算出手段 5a 平均算出手段 5b バッファ 6a,6b,6c,6d,6e,6f 伝送スペクトル選択手段 7 情報伝送手段 8 情報受信手段 9 平均雑音パワースペクトル保持手段 11 重畳雑音合成手段 12 雑音区間合成音出力手段 13 有音区間合成音出力手段 13a 有音合成手段 13b 重畳手段 13c,13d,13e,13f B. 2 voice / noise determination unit 3 spectral analysis means 4 spectral subtraction means 5 average noise power spectrum calculation unit 5a average calculating unit 5b buffer 6a, 6b, 6c, 6d, 6e, 6f transmission spectrum selection unit 7 information transmitting unit 8 information received means 9 average noise power spectrum holding means 11 superimposes the noise synthesis unit 12 noise period synthesis sound output unit 13 sound period synthesized sound output unit 13a voiced synthesis unit 13b superimposing means 13c, 13d, 13e, 13f B. P. P. F 13g,13h,13i,13j 重畳手段 14 受信側平均雑音パワースペクトル算出手段 15 雑音区間音声合成手段 16 重畳倍率制御手段 16a 重畳倍率算出手段 16b 雑音パワースペクトル平均算出手段 16c 有音パワースペクトル平均算出手段 17 帯域別重畳倍率制御手段 17a,17b,17c,17d 平均パワースペクトル算出手段 17e,17f B. F 13g, 13h, 13i, 13j superimposing means 14 receiving-side average noise power spectrum calculating unit 15 noise interval speech synthesis means 16 superimposes the magnification control means 16a superimposing ratio calculating means 16b noise power spectrum averaging means 16c voice power spectrum averaging means 17 per-band superposition ratio control means 17a, 17b, 17c, 17d average power spectrum calculating means 17e, 17f B. P. P. F 19 信号強度比による引き去り率算出手段 19a 有音平均パワースペクトル算出手段 19b 平均雑音パワースペクトル算出手段 19c パワー比算出手段 20 帯域別引き去り率算出手段 20a,20b,20c,20d,20e,20f F 19 signal intensity ratio by subtraction ratio calculating means 19a voiced average power spectrum calculating unit 19b average noise power spectrum calculating unit 19c power ratio calculating means 20 per band subtraction rate calculating means 20a, 20b, 20c, 20d, 20e, 20f
B. B. P. P. F 20m,20n,20p 引き去り算出手段 20q,20r,20s,20t,20u,20v 引き去り手段 20w 出力スペクトル再生成手段 101 音声信号 102 有音/雑音判定情報 103 パワースペクトル 104 雑音引き去りパワースペクトル 105 平均雑音パワースペクトル 106 伝送スペクトル情報 111 重畳雑音 112 出力音声 116 重畳倍率 117 帯域別重畳倍率 118 スペクトル引き去り率 200 伝送路 F 20m, 20n, 20p subtraction calculation means 20q, 20r, 20s, 20t, 20u, 20v subtraction means 20w output spectrum regeneration unit 101 audio signal 102 sound / noise determination information 103 power spectrum 104 noise subtraction power spectrum 105 average noise power spectrum 106 transmission spectrum information 111 superimposed noise 112 output sound 116 superimposed magnification 117 per band superimposed magnification 118 spectral subtraction factor 200 transmission line

───────────────────────────────────────────────────── フロントページの続き (72)発明者 白木 宏一 鎌倉市大船五丁目1番1号 三菱電機株 式会社 情報システム研究所内 (72)発明者 古田 訓 鎌倉市大船五丁目1番1号 三菱電機株 式会社 情報システム研究所内 (56)参考文献 特開 平3−179500(JP,A) 特開 平5−136746(JP,A) 特開 昭60−140399(JP,A) 特開 平2−278298(JP,A) 特開 昭54−133003(JP,A) 特開 平5−56007(JP,A) (58)調査した分野(Int.Cl. 7 ,DB名) G10L 11/00,13/00 G10L 19/00,21/02 ────────────────────────────────────────────────── ─── of the front page continued (72) inventor Koichi Shiraki Kamakura Ofuna chome No. 1 No. 1 Mitsubishi Electric Co., Ltd. information system within the Institute (72) inventor Kun Furuta Kamakura Ofuna chome No. 1 No. 1 Mitsubishi Electric Co., Ltd. information system Institute (56) references Patent Rights 3-179500 (JP, A) Patent Rights 5-136746 (JP, A) JP Akira 60-140399 (JP, A) Patent Rights 2- 278298 (JP, a) JP Akira 54-133003 (JP, a) JP flat 5-56007 (JP, a) (58 ) investigated the field (Int.Cl. 7, DB name) G10L 11 / 00,13 / 00 G10L 19 / 00,21 / 02

Claims (10)

    (57)【特許請求の範囲】 (57) [the claims]
  1. 【請求項1】 入力音声信号を所定の分析フレーム単位 1. A input speech signal a predetermined analysis frame
    毎にスペクトル分析してパワースペクトルを求めるスペ Space to determine the power spectrum and spectrum analysis for each
    クトル分析手段と、 上記分析フレームの内の雑音区間フレームに対して規定 Defining a vector analyzing means, with respect to noise section frame of said analysis frame
    のフレーム分の平均雑音パワースペクトルを求める平均 Average to determine the average noise power spectrum of the frame
    雑音パワースペクトル算出手段と、 有音区間では上記スペクトル分析手段出力から上記平均 And the noise power spectrum calculating means, the average from the spectral analysis means outputs a sound period
    雑音パワースペクトルを減算した雑音引き去りパワース Noise subtraction Pawasu the noise power spectrum obtained by subtracting
    ペクトルを、雑音区間では上記平均雑音パワースペクト The spectrum, the average noise power in the noise section spectrum
    ルを、選択して伝送スペクトルとし送信する伝送スペク Transmission spectrum of the Le, and transmitting the transmission spectrum by selecting
    トル選択伝送手段を備えた雑音抑圧音声分析装置。 Noise suppressing sound analysis apparatus having a torque selecting transmission means.
  2. 【請求項2】 雑音区間フレームでは、該雑音フレーム 2. The method of claim 1] in the noise section frame, The noise frame
    の瞬時雑音パワースペクトルを送信するようにしたこと In the can to send the instantaneous noise power spectrum of
    を特徴とする請求項1記載の雑音抑圧音声分析装置。 Noise reduced speech analyzer according to claim 1, wherein.
  3. 【請求項3】 入力音声信号を所定の長さの分析フレー 3. Analysis frame of input speech signal a predetermined length
    ム単位で分割し、該分析フレームを有音区間フレームと It is divided by beam basis, and voiced section frame the analysis frame
    雑音区間フレームに分け、雑音区間フレームに対しては Divided into noise section frame, with respect to the noise section frame
    スペクトル分析して平均雑音パワースペクトルを記憶す To store the average noise power spectrum and spectrum analysis
    る平均雑音パワースペクトル保持手段と、 上記平均雑音パワースペクトルを入力として合成音を生 That the average noise power spectrum holding means, the synthesized speech as inputs the average noise power spectrum raw
    成する重畳雑音合成手段と、 入力信号が有音区間の場合は、入力の有音区間の音声信 And superimposing the noise synthesizing means for forming, when the input signal is speech interval, the speech signal of the voiced interval in the input
    号と、上記重畳雑音合成手段出力の合成音とを所定の重 No. and, given a synthesized sound of the superimposition noise synthesizing means outputs Weight
    畳倍率をかけて重畳して有音区間の合成音を生成して出 Over the tatami magnification out to generate a synthesized sound of superimposed voiced section
    力する有音区間合成音出力手段と、 上記有音区間合成音出力手段と重畳雑音合成手段出力と A sound interval synthesized sound outputting means for force, and superimposing the noise synthesizing means outputs said sound period synthesized sound output means
    により上記重畳倍率を計算し制御し、入力信号が雑音区 The superposition ratio calculated controlled by the input signal is noise-ku
    間の場合は、上記重畳雑音合成手段出力に重畳倍率をか For while either the superposition ratio to the superimposed noise synthesizing means outputs
    けて雑音区間の合成音を出力するよう制御する重畳倍率 Superimposing magnification controls to output only synthesized sounds in a noise period
    制御手段と、を備えたことを特徴とする雑音抑圧音声合 Noise suppression speech case, characterized in that it comprises a control means, the
    成装置。 Forming apparatus.
  4. 【請求項4】 入力音声信号を所定の長さの分析フレー 4. Analysis frame of input speech signal a predetermined length
    ム単位で分割し、該分析フレームを有音区間フレームと It is divided by beam basis, and voiced section frame the analysis frame
    雑音区間フレームに分け、雑音区間フレームに対しては Divided into noise section frame, with respect to the noise section frame
    スペクトル分析して平均雑音パワースペクトルを記憶す To store the average noise power spectrum and spectrum analysis
    る平均雑音パワースペクトル保持手段と、 上記平均雑音パワースペクトルを入力として合成音を生 That the average noise power spectrum holding means, the synthesized speech as inputs the average noise power spectrum raw
    成する重畳雑音合成手段と、 有音区間フレームのスペクトルを所定の周波数帯域に区 And superimposing the noise synthesizing means for forming, Gu the spectrum of voiced section frame to a predetermined frequency band
    切って帯域別に重畳倍率を制御する帯域別重畳倍率制御 Per-band superposition ratio control for controlling the superimposing magnification by band cut
    手段と、 入力信号が有音区間の場合は、入力の有音区間の音声信 Means and, if the input signal is speech interval, the speech signal of the voiced interval in the input
    号と、上記重畳雑音合成手段出力の合成音とを上記帯域 No. and, the band and the synthesized sound of the superimposition noise synthesizing means outputs
    別重畳手段が制御する重畳倍率をかけて重畳して有音区 Voiced ku superimposed over superimposed magnification another superimposing means controls
    間の合成音を生成して出力する有音区間合成音出力手段 Sound interval synthesized sound output means for generating and outputting a synthesized sound between
    と、を備えたことを特徴とする雑音抑圧音声合成装置。 When noise suppression speech synthesis apparatus characterized by comprising a.
  5. 【請求項5】 平均雑音パワースペクトル保持手段は、 5. The average noise power spectrum holding means,
    瞬時雑音パワースペクトルが送信された場合は、該瞬時 If the instantaneous noise power spectrum has been sent, the time of the instantaneous
    雑音パワースペクトルを規定のフレーム分平均化して平 Flat the noise power spectrum to frame averaging of the provisions
    均雑音パワースペクトルとして記憶し、 雑音区間フレームでは、送信された瞬時雑音パワースペ Stored as average noise power spectrum, in noise section frame transmitted instantaneous noise Pawasupe
    クトルまたは上記平均雑音パワースペクトルを基に出力 Vector or output based on the average noise power spectrum
    するようにしたことを特徴とする請求項3または請求項 Claim 3 or claim, characterized in that the the to
    4いずれか記載の雑音抑圧音声合成装置。 4 noise reduced speech synthesis apparatus according to any one.
  6. 【請求項6】 スペクトル分析手段出力から平均雑音パ 6. average noise path from the spectral analysis means outputs
    ワースペクトル算出手段出力を減算率を掛けて減算して The word spectrum calculation means outputs the subtraction by multiplying the subtraction factor
    雑音引き去りパワースペクトルを求めるスペクトル減算 Noise subtraction spectral subtraction to determine the power spectrum
    手段と、 上記スペクトル分析手段出力の値により上記減算率を定 And means, the subtraction factor according to the value of the spectral analysis means outputs a constant
    める引き去り率算出手段を備えて、有音区間フレームで It includes a Mel subtraction rate calculation means, with sound period frame
    は上記雑音引き去りパワースペクトルを伝送することを It is to transmit the noise subtraction power spectrum
    特徴とする請求項1記載の雑音抑圧音声分析装置。 Noise reduced speech analyzer according to claim 1, wherein.
  7. 【請求項7】 引き去り率算出手段は、有音区間のスペ 7. A subtraction rate calculation means, the sound interval space
    クトル分析手段出力の周波数帯域別に引き去り率を算出 Calculating a subtraction factor for each frequency band of the spectrum analyzing means outputs
    するようにし、スペクトル減算手段は、上記周波数帯域 To make it, the spectral subtraction means, said frequency band
    別の引き去り率で平均雑音パワースペクトルを減算する Subtracting the average noise power spectrum in a different subtraction rate
    こと特徴とする請求項1記載の雑音抑圧音声分析装置。 Noise suppressing sound analysis apparatus according to claim 1, this and characteristics.
  8. 【請求項8】 引き去り率算出手段は、有音区間の雑音 8. subtraction factor calculating means, noise sound period
    引き去りパワースペクトル出力をみて予め定めたしきい Threshold was determined in advance to see the power spectral output subtraction
    値以下になると、上記雑音引き去りパワースペクトル出 If a value below, out of the noise subtraction power spectrum
    力が該予め定めたしきい値を出力するようにしたこと特 JP that force is to output a threshold that defines Me該予
    徴とする請求項1記載の雑音抑圧音声分析装置。 Noise reduced speech analyzer according to claim 1 wherein symptoms.
  9. 【請求項9】 入力音声信号を所定の分析フレーム単位 9. input speech signal a predetermined analysis frame
    毎にスペクトル分析 してパワースペクトルを求めるスペ Space to determine the power spectrum and spectrum analysis for each
    クトル分析手段と、 上記分析フレームの内の雑音区間フレームに対して規定 Defining a vector analyzing means, with respect to noise section frame of said analysis frame
    のフレーム分の平均雑音パワースペクトルを求める平均 Average to determine the average noise power spectrum of the frame
    雑音パワースペクトル算出手段と、 上記スペクトル分析手段出力から上記平均雑音パワース And the noise power spectrum calculating means, the average noise Pawasu from said spectrum analysis means outputs
    ペクトルを減算した雑音引き去りパワースペクトルと、 And the noise subtraction power spectrum obtained by subtracting the spectrum,
    上記平均雑音パワースペクトルとを選択し、伝送スペク Select and the average noise power spectrum, transmission spectrum
    トルとして送信する伝送スペクトル選択伝送手段を備え Comprising a transmission spectrum selection transmitting means for transmitting a torque
    た雑音抑圧音声分析装置と、 伝送された分析フレーム毎の信号を、雑音区間フレーム A noise reduced speech analysis apparatus, a signal for each analysis frame which is transmitted, noise segment frame
    に対してはそのスペクトルに対応して平均雑音パワース The average in response to the spectrum for the noise Pawasu
    ペクトルを記憶する平均雑音パワースペクトル保持手段 Average noise power spectrum holding means for storing the spectrum
    と、 上記平均雑音パワースペクトルを入力として合成音を生 And, the synthesized sound as input the above average noise power spectrum raw
    成する重畳雑音合成手段と、 入力信号が有音区間の場合は、入力の有音区間の音声信 And superimposing the noise synthesizing means for forming, when the input signal is speech interval, the speech signal of the voiced interval in the input
    号と上記重畳雑音合成手段出力の合成音とを重畳して有 Yes by superimposing the issue and the superimposition noise synthesizing means outputs synthesized speech
    音区間の合成音を生成し出力する有音区間合成音出力手 Sound interval synthesized sound output hand that generates and outputs a synthesized sound of the audio section
    段を備えた雑音抑圧音声合成装置とで構成される音声伝 Voice Den composed of a noise reduced speech synthesis apparatus which includes a stage
    送システム。 Transmission system.
  10. 【請求項10】 平均雑音パワースペクトルを可変の減 10. A variable reduction of the average noise power spectrum
    算率で減算して雑音引き去りパワースペクトルとした雑 Miscellaneous, which was the power spectral subtraction noise is subtracted in the calculated rate
    音抑圧音声分析装置とし、 入力の有音区間の音声信号に、重畳雑音合成手段出力を And a sound suppressing sound analysis device, the audio signal of the voiced interval in the input, the superimposing noise combining means output
    可変の重畳倍率を掛けて重畳して有音区間の合成音を生 Raw synthesized speech of voiced segments superimposed over the variable superimposed magnification
    成し出力するようにした雑音抑圧音声合成装置としたこ This was the noise suppression speech synthesis apparatus adapted to form output
    とを特徴とする請求項9記載の音声伝送システム。 Voice transmission system of claim 9, wherein the door.
JP3718594A 1994-03-08 1994-03-08 Noise reduced speech analyzer and noise reduced speech synthesis apparatus and a speech transmission system Expired - Fee Related JP3353994B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3718594A JP3353994B2 (en) 1994-03-08 1994-03-08 Noise reduced speech analyzer and noise reduced speech synthesis apparatus and a speech transmission system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3718594A JP3353994B2 (en) 1994-03-08 1994-03-08 Noise reduced speech analyzer and noise reduced speech synthesis apparatus and a speech transmission system

Publications (2)

Publication Number Publication Date
JPH07248793A JPH07248793A (en) 1995-09-26
JP3353994B2 true JP3353994B2 (en) 2002-12-09

Family

ID=12490532

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3718594A Expired - Fee Related JP3353994B2 (en) 1994-03-08 1994-03-08 Noise reduced speech analyzer and noise reduced speech synthesis apparatus and a speech transmission system

Country Status (1)

Country Link
JP (1) JP3353994B2 (en)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1192358C (en) 1997-12-08 2005-03-09 三菱电机株式会社 Sond signal processing method and sound signal processing device
JP2000022603A (en) * 1998-07-02 2000-01-21 Oki Electric Ind Co Ltd Comfort noise generator
JP3451998B2 (en) 1999-05-31 2003-09-29 日本電気株式会社 Speech encoding / decoding device including non-speech encoding, decoding method, and recording medium recording program
JP3566197B2 (en) * 2000-08-31 2004-09-15 松下電器産業株式会社 Noise suppression apparatus and noise suppression method
CN100593197C (en) * 2005-02-02 2010-03-03 富士通株式会社 Signal processing method and device thereof
US9185487B2 (en) 2006-01-30 2015-11-10 Audience, Inc. System and method for providing noise suppression utilizing null processing noise subtraction
US8949120B1 (en) 2006-05-25 2015-02-03 Audience, Inc. Adaptive noise cancelation
JP2008216720A (en) 2007-03-06 2008-09-18 Nec Corp Signal processing method, device, and program
JP2008216721A (en) * 2007-03-06 2008-09-18 Nec Corp Noise suppression method, device, and program
US8744844B2 (en) * 2007-07-06 2014-06-03 Audience, Inc. System and method for adaptive intelligent noise suppression
JP5299631B2 (en) * 2009-05-13 2013-09-25 日本電気株式会社 Speech decoding apparatus and speech processing method thereof
JP5287502B2 (en) * 2009-05-26 2013-09-11 日本電気株式会社 Speech decoding apparatus and method
US9558755B1 (en) 2010-05-20 2017-01-31 Knowles Electronics, Llc Noise suppression assisted automatic speech recognition
US9640194B1 (en) 2012-10-04 2017-05-02 Knowles Electronics, Llc Noise suppression for speech processing based on machine-learning mask estimation
US9536540B2 (en) 2013-07-19 2017-01-03 Knowles Electronics, Llc Speech signal separation and synthesis based on auditory scene analysis and speech modeling
US9799330B2 (en) 2014-08-28 2017-10-24 Knowles Electronics, Llc Multi-sourced noise suppression

Also Published As

Publication number Publication date
JPH07248793A (en) 1995-09-26

Similar Documents

Publication Publication Date Title
JP5666021B2 (en) Apparatus and method for processing a decoded audio signal in the spectral domain
EP1509903B1 (en) Method and device for efficient frame erasure concealment in linear predictive based speech codecs
US6351731B1 (en) Adaptive filter featuring spectral gain smoothing and variable noise multiplier for noise reduction, and method therefor
JP5193413B2 (en) Error concealment for decoding coded audio signals
US8612222B2 (en) Signature noise removal
US6810377B1 (en) Lost frame recovery techniques for parametric, LPC-based speech coding systems
RU2345506C2 (en) Multichannel synthesiser and method for forming multichannel output signal
CN1989548B (en) Audio decoding device and compensation frame generation method
EP2194528B1 (en) Reconstruction of the spectrum of an audiosignal with incomplete spectrum based on frequency translation
AU752229B2 (en) Perceptual weighting device and method for efficient coding of wideband signals
US6539355B1 (en) Signal band expanding method and apparatus and signal synthesis method and apparatus
JP3263168B2 (en) Method and decoder for encoding an audible sound signal
US5819212A (en) Voice encoding method and apparatus using modified discrete cosine transform
CA2596341C (en) Method for concatenating frames in communication system
CN101501763B (en) Audio codec post-filter
JP4274586B2 (en) High resolution post-processing method and apparatus for speech decoder
JP4173641B2 (en) Voice enhancement by gain limitation based on voice activity
US5012519A (en) Noise reduction system
Jabloun et al. Incorporating the human hearing properties in the signal subspace approach for speech enhancement
EP0698877B1 (en) Postfilter and method of postfiltering
JP4137634B2 (en) Voice communication system and method for handling lost frames
AU656787B2 (en) Auditory model for parametrization of speech
US6334105B1 (en) Multimode speech encoder and decoder apparatuses
ES2334403T3 (en) Method and apparatus for decoding a signal using spectral band replication and interpolation of scale factors.
ES2266003T3 (en) Softener of the gain in a broadband signal and audio signal decoder.

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20020903

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20040520

LAPS Cancellation because of no payment of annual fees