JPS61286900A - 信号処理装置 - Google Patents

信号処理装置

Info

Publication number
JPS61286900A
JPS61286900A JP60129696A JP12969685A JPS61286900A JP S61286900 A JPS61286900 A JP S61286900A JP 60129696 A JP60129696 A JP 60129696A JP 12969685 A JP12969685 A JP 12969685A JP S61286900 A JPS61286900 A JP S61286900A
Authority
JP
Japan
Prior art keywords
spectrum
signal
data
time
noise
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP60129696A
Other languages
English (en)
Inventor
田村 震一
健三 赤桐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP60129696A priority Critical patent/JPS61286900A/ja
Publication of JPS61286900A publication Critical patent/JPS61286900A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Noise Elimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 以下の順序でこの発明を説明する。
A 産業上の利用分野 B 発明の概要 C従来の技術 D 発明が解決しようとする問題点 E 問題点を解決するための手段(第1図)F 作用 G 実施例(第2図) G1短時間フーリエ解析の説明 (第3図、第5図、第6図) G2スペクトル処理部(23)の説明(第7図)G3短
時間フーリエ解析の逆演算の説明(第4図) H発明の効果 A 産業上の利用分野 この発明はノイズ成分を含む音声信号や映像信号の信号
強調及びノイズリダクションを行なう信号処理装置に関
する。
B 発明の概要 この発明はノイズ成分を有する音声信号や映像信号に直
交変換を施こし、得られた成分のダイナミックレンジを
拡大する非線形処理を行ない、これを逆直交変換によっ
て元の時間軸上に戻すようにしたもので、これにより信
号成分の強調及びノイズの低減を図ったものである。
C従来の技術 ノイズ成分を有する音声信号や映像信号の明瞭度の向上
、ノイズの低減を図る場合、従来量も良く使用されるの
は周波数軸上のフィルタリング処理によって、信号成分
がノイズ成分に比して多い周波数画成では利得を増加さ
せ、ノイズ成分が主となっている周波数帯域では利得を
低減させる方法である。
この方法を実施するには、従来、信号の全周波数帯域を
対数軸上で10〜20等分した例えばバンドパスフィル
タバンクを使用することが主であった。
D 発明が解決しようとする問題点 とこ・ろが、上述のような方法を用いた場合には、時間
的に変化している信号スペクトルに対し、固定した通過
周波数のフィルタを用いることになり、大まかな調整し
かできないことと相俟って信号そのものを低下させてし
まうことも多く、明瞭度。
ノイズ低減の向上はあまり望むことができなかった。
E 問題点を解決するための手段 この発明は上記の欠点を改善するため、以下のように構
成する。
すなわち、第1図はこの発明装置の一例で、(1)は音
声信号又はビデオ信号の入力端子、(2)はA/Dコン
バータ、(3)はフーリエ変換等の直交変換回路、(4
)はパワースペクトラム算出回路(41)及びパワース
ペクトラム強調回路(42)からなるスペクトル処理部
、(5)は逆フーリエ変換等の逆直交変換回路、(6)
はこの逆直交変換回路(5)よりのデジタル出力をアナ
ログ信号に戻すD/Aコンバータ、(7)は出力端子で
ある。
F 作用 入力端子(1)を通じた音声信号又は映像信号はA/D
コンバータ(2)にてデジタル信号に変換された後、直
交変換回路(3)に供給される。
この直交変換回路(3)においては例えばフーリエ変換
されて時間軸が周波数軸に変換されたスペク     
 1トルが形成される。
この直交変換回路(3)の出力はスペクトル処理部(4
)のパワースペクトル算出回路(41)において例えば
絶対値演算がなされてパワースペクトルが算出される。
算出されたパワースペクトルはパワースペクトル強調回
路(42)に供給されて、スペクトルの振幅成分の包路
線の山と谷とが強調される。
この強調回路(42)の出力は逆直交変換回路(5)に
供給されて例えば逆フーリエ変換されて周波数軸が時間
軸に戻される。
そして、この時間軸に戻された信号がD/Aコンバータ
(6)によってアナログ信号に戻され、出力端子(7)
に導出される。
言語情報は短時間スペクトルの振幅成分のスペクトル包
路線の山、谷の位置と大きさが担っているので、上記の
ようなスペクトル強調によって言語情報の明瞭度が向上
する。
また、スペクトルがノイズに汚されていた場合、ノイズ
に汚されたスペクトルの谷は、信号のスペクトルがノイ
ズのスペクトルにうずもれてしまった部分と考えられ、
またスペクトルの山はノイズに汚されつつも、なお、信
号のスペクトルの特徴を有している部分と考えられる。
したがって、スペクトル強調されてスペクトルの山と谷
のピークの差が広がる(ダイナミックレンジが広がる)
ことによって、ノイズ部分のみレベルが少なくなったこ
とになり、もとの情報信号を失うことなく、ノイズ低減
が可能になる。
G 実施例 第2図はこの発明の一実施例を示すもので、この例では
スペクトラム領域で処理したスペクトラムに基づいて時
間領域の信号を作成するに際し、5TFT (Shor
t Tinge Fourier Transfora
+)  (IIEEETRANSACTIONS ON
 ACOUSTIC5,5PII!ECH,AND 5
IGNALPROCESSING、VOL、ASSP−
28,NO,1,FfiBRUARY 1980P、9
9〜P、 102参照)による合成アルゴリズムを用い
ている。
同図において、入力音声はマイクロホン(1工)及びア
ンプ(12)によって電気信号に変換され、これがロー
パスフィルタ(工3)に供給されて帯域が例えば3.2
kHzに制限される。このローパスフィルタ(13)を
通った信号はA/Dコンバータ(14)に供給される。
このA/Dコンバータ(14)にはクロック発生回路(
15)よりの6.4kHzのサンプリングクロックC1
hが供給されてアナログ信号が1ワード12ビツトのデ
ジタル信号に変換される。このデジタル信号はシフトレ
ジスタ(16)に、クロック発生回路(15)よりの6
.4kHzのシフトクロックC1hで順次書き込まれる
。この場合、このシフトレジスタ(16)は256ワ一
ド分の容量を有する。
すなわちシフトレジスタ(16)には、A/Dコンバー
タ(14)によって生成された、一連の256ワードの
デジタルデータがはいっており、A/Dコンバータ(1
4)が、デジタルデータを1語、生成するごとに、シフ
トレジスタ(3)は、1語、右にシフトされ、その内容
が更新されてゆく。
G1短時間フーリエ解析の説明 ここで、第2図におけるシフトレジスタ(16)以下の
信号の具体的な流れについて説明する前に、短時間フー
リエ解析について、一般的な事柄を述べておく。
例えば、「あいうえお」という音声信号を考えてみると
、「あ」という音が発せられている時間と、「い」とい
う音が発せられている時間とでは、音声を発しているヒ
トの口や声道の形状が異なっている。すなわち「あいう
えお」という音声信号は、時間とともにその特性が変化
してゆく物理的実体から発せられた信号であり、定常信
号とは見なせない。
このように、音声信号や音楽信号などは、それを発して
いる物理的実体の特性が、時間とともに変化しており、
一般に定常信号と見なすことはできず、定常信号を対象
にしたフーリエスペクトラム解析を直接に通用すること
は不可能である。しかしながら、先はどの例の「あいう
えお」について言うと、「あ」、「い」、「う」、「え
」。
「お」の各々の音声を発している時間内では、ヒトの口
や声道の形状は、はぼ一定しており、その時間内に信号
を限定すれば、定常信号と見なせる。
そこで、フーリエ変換する領域を、定常と見なせる時間
の区間に限定してフーリエ変換をおこない、その区間を
次々に更新してゆき、得られるフーリエスペクトラムを
用いれば、非定常ではあるが、短時間の区間については
定常であるような、音声信号や音楽信号に対してフーリ
エ解析が可能になる。
このようなフーリエ解析は、短時間フーリエ解析と呼ば
れている。
数式を用いてさらに説明しよう、入力信号x (tlを
サンプリングして得られるデータ列を(X(ホ))(m
=0.1.2.・・・・)としたとき、上述した事柄は
、定常とみなせるデータの部分列(x (m+sR) 
)Cm=OA+・・−; 5=(LL−・−R,Mはあ
る整定数)の変数mについて、有限の部分列(x(m+
SR) )  (m=0.1s・・・、 M−1)の端
部がスペクトルに及ぼす影響を減じる窓係数(h(−m
))(m=0.1.・・・・、ト1)を乗じた後、変数
mについて離散的フーリエ変換をおこない、短時間フー
リエスペクトラムX (SR,k)  (S=0.1.
・・・・1M−1; k = 0.1.2.・・・・、
ト1)を得る、ということになる。
2π 第5図より明らかなように、Rは分析すると区間の更新
量であり、以下のような制約がある。
(1)式より 2π m + SR= fとおくと 2π ・・・・(2) 窓係数(h (−m) )  (m=0.1.2.・・
・・、 M−1)の定義を、mについて一〇〜+■まで
拡大して、とすると 2π すなわち、X(SR,k)は、第6図に示すように第1
番目の変数SRについて、データ列(S = O,L、
2.・・・・)をR−1データおきに再サンプリングし
たものになっており、デジタル信号ンバルスレスポンス
(h (m) )を有する線形デジタルシステムに入力
した出力を、R−1データおきに再サンプリングしたも
のと解釈できる。
故に、分析する区間の更新量RXIは、サンプ 5でな
ければならない。
(X (m、k) )  (m=0.1.2.・・・・
)の帯域幅は、の上限は、図に於ける、インパルスレス
ポンス(h (m) )を有する線形デジタルシステム
の口すなわちRは、 ・・・・(5) でなければならない。
一例として、M=256. (h (m) ) として
ハミング窓係数とすると窓係数h (m) = 0.5
4−0.46X cos    ’(2πm/255 
)  (m=o、1.・・・・、 255 )を用いる
とすると、(h (m) )  (m=0.1.2.”
・、 255)のローパス部分の帯域幅は、約42dB
まで減衰するかって、Rは、上式の関係から、 R≦□=64 でなければならない。
第4図において、シフトレジスタ(18)以降で上述し
た、短時間フーリエ変換をおこなっている。
M = 256 、分析窓係数として、ハミング窓係数
h (m) =0.54−0.46XCO3(2πm/
255 )(m = 0.1.2.・・・・、 255
 ) 、R−64としている。
上述の例で明らかなように、R=64は、(5)式を満
たしている。
以下、具体的に述べる。
1ワード12ビツト、256ワードより成るシフトレジ
スタ(16)の内容は、A/D変換器(14)の駆動ク
ロックCLを分周回路(17)で64分周したクロック
CK2の1パルス(すなわち、64X (A/D変換(
14)の駆動クロック周期、約158μsec )(秒
))ごとに、同じくlワード12ビツト、256ワード
よりなるシフトレジスタ(18)にラッチされる。ラッ
チされた256ワードのデータは、クロック発生回路(
19)よりの10MHz (周期100 n sec 
)のクロックCK3のタイミングで、1ワードずつ図中
布ヘシフトされ、12ビツトより成る2つの入力端子、
および23ビツトより成る1つの出力端子を有する乗算
器(20)の一方の入力端子におくりこまれる。一方、
この同じクロックCK3のタイミングで、乗算器(20
)のもう一方の入力端子に、あらかじめROM(21)
に貯えであるハミング窓係数h (m) −0,54−
0,46cos (2rc m/ 255 )(m’=
011121・・・・、 255 )が、−語ずつ、m
=0゜1.2.・・・・の順に、おくりこまれ、この2
つの入力の積が、乗算器(20)の出力として、入力デ
ータがセットされてから100 n sec後に、乗算
器(20)の出力端子にセットされる。
この、乗算器(20)の23ビツトより成る出力結果は
、乗算器(20)に入力データを送りこむタイミングク
ロックのタイミングで(すなわち、100n secご
とに) F F T (Fast Fourier T
ransform)変換器(22)へ送りこまれる。F
FT変換器(22)は、こうして送りこまれるlワード
23ビツトのデータが256ワードになると、この1ワ
ード23ビツト、256ワードのデータに対して、FF
Tをおこない、実部、虚部ともに16ビツトから成る2
56ワードの複素データを生成する。
すなわち、マイクロホン(11)に第3図Aに示すよう
な信号が供給されると、同図Aに示すように所定時間り
分ずつ、所定時間長L−R分だけ前の信号とオーバーラ
ツプして信号が抽出される。
換言すれば時間R毎に時間長り分ずつ信号がA/Dコン
バータ(14)の出力より抽出されてシフトレジスタ(
18)の出力に得られる。そしてこの抽出された信号は
フーリエ変換されて第3図Bに示すように時間軸が周波
数軸に変換されたスペクトラムが形成される。
なお、第3図は説明の便宜上アナログで示した。
G2スペクトル処理部(23)の説明 このFFT変換器(22)よりの256個の複素スペク
トラムデータC(1)  (l=0.1,2.・・・・
、255)はスペクトル処理部(23)に供給される。
スペクトル処理部(23)では複素スペクトラムC(1
)が絶対値計算回路(231)に供給されてパワースペ
クトラムが計算される。
すなわち、複素スペクトラムC(Il)のうち信号成分
を S (1) =S (1) R+jS(6) Iノイズ
成分を n (1) =n (f) yt +jn(Iり Iと
すると、複素スペクトラムCCG は、CCQ″)= 
(S(ffi)a + n(I2)R) + j  (
S(ffi)+  + no2)+ )となり、パワー
スペクトルCA(1)は、(cA(1り) 2= l 
C(I2) + 2= ((S(12)J +5(I2
)+23 + ((n(1りJ + n(ffi)+2
)+2 ((n(ffi)a −3(Q)+ ) +2
 ((n(Q)r 5(12)R)・・・・(6)j ここで信号とノイズとは無相関とみなせるから、n (
1)R−8(1)! =O n  (jり  I=S  (j’)  R=0である
。(6)式で第1項目は信号のパワースペクトラムであ
り、第2項目はノイズのパワースペクトラムである。
一般にノイズ成分は小さいから、信号のパワースペクト
ラムの谷の方が、このノイズの影響を受けていると考え
られる。
以上から、絶対値計算回路(231”)では、・・・・
(7) が計算されることになる。この値CA(jりは各々16
ビツトから成る。
この計算結果は対数計算回路(232’)に供給され、
これにおいて、 CB (Il) = log (cA(12))  C
I=0.l、2.・・・・255 )・・・・(8) が計算される。CB(1)も各々16ビツトから成る。
この対数計算回路(232)の出力はべき乗計算回路(
233)に供給され、予めROM(234)に設定され
るべき乗の値によりべき乗計算される。
この例ではべき乗の値は1.2とされ、CCC1) =
 (cB(ffi)) !・2       ・・・・
(9)なる計算がなされて16ビソトのデータCC(1
)が得られる。
このデータCC(1)は次にe X計算回路(235)
に供給され、 CD (1) = exp (cC(12))    
    ・・・・Qlなる計算がなされて、16ビツト
のデータCD(1)が得られる。
また、以上と並行してFFT変換器(22)からのデー
タC(1)は位相算出回路(236)に供給されて、こ
の位相算出回路(236)において、P j=、/”了、 1=0.1.2.・・・・255  
 ・・・・(11)が計算される。この位相データCP
(1)は実部、虚部ともに16ビツトからなる複素デー
タである。
こうしてeX計算回路(235)及び位相算出回路(2
36)より得られたデータCD(1)及びCP(J)は
、各々、1=0.1.2.・・・・の順に複素乗算回路
(237)に供給されて、実部、虚部ともに16ビツト
からなる乗算出力が得られる。
以上のようにスペクトル処理部(23)では入力信号の
短時間スペクトルの対数振幅成分が1.2乗されている
。このようにされると、第7図Aの入力信号のスペクト
ルは同図Bに示すように、その対数振幅成分の山と谷の
各々のピークの差が広がり、スペクトラムの山、谷が強
調されることになる。すなわち、スペクトラムのダイナ
ミックレンジが広がることになる。
その結果、以下のような効果が得られることになる。
すなわち、一般的に「ア」とか「イ」とかいうような言
語情報は(短時間)スペクトルの振幅成分の包路線の山
、谷の位置と大きさかになっているわけであるが、その
スペクトル包絡の山、谷が強調されることから言語情報
の明瞭度が向上するものである。
また、スペクトラムがノフイズに汚されている場合を考
えてみると、ノイズに汚されたスペクトルの谷は、信号
のスペクトラムがノイズのスペクトラムに埋もれてしま
った部分、また山はノイズに汚されつつも、なお、信号
のスペクトラムの特徴を有している部分と考えられる。
したがって、スペクトルの山、谷のピークの差が広がる
(ダイナミンクレンジが広がる)ことによってノイズ部
分のみのレベルが小さくなり、元の「情報部分」を失う
ことなく、ノイズ低減が可能となるものである。
G3短時間フーリエ解析の逆演算の説明以上のようなス
ペクトル処理部(23)の出力は順次逆FFT変換器(
24)に供給される。そして、この逆FFT変換器(2
4)及びそれ以降の回路によりスペクトル処理部(23
)よりの複素データは時間領域の信号に戻される。これ
らFFT変換器      1(24)以降の回路につ
いて説明する前に、これらに関しての一般的な関係につ
いて述べておく。
先に述べたように、変形された短時間フーリエスペクト
ラム9 (SR’ 、 k )  (S=0.112.
・・・冒に=o、1,2.・・・・、トl)は、短時間
フーリエスペクトラムX (S、k)  (S=0.1
.2.・・−、に=0.1゜2、・・・・、 M:t 
>を、第1番目の変数Sについて、R’−1データおき
に再サンプリングしたものである。そこで、変形された
短時間フーリエスペクトラムX (SR’ 、 k) 
 (S=0.1.2.・・・・i  k=0゜1.2.
・・・・、トl)から、時間領域の信号を作成するには
、9(SR・、k)  (S=0.1,2.・・・・、
  k=0.1,2.・・・・、ト1)を補間して、9
(s、k)(S=0.1.2.・・・・;  k=0.
1.2.・・・・、 M−1)を作り、△ X (S、k)  (S=0.1.2.・・・・、  
k=0.1,2.・・・・。
ト1)を逆離散的フーリエ変換すれば良い。すなわち、
X (SR’ 、 k)の第1番目の変数に関して、各
々、隣りのデータの間に0をR’−1r11つめたデー
タX(S、k)、すなわち、 を作り、M個のデータ(f  (m) )  (m=0
.1.・・・・、M−1)をインパルスレスポンスとし
て持つローパスフィルタに通して、9(S、k)を作る
。式X(ik)の定義より II+5−■ この後、X(S、k)を第2番目の変数kに関して、逆
離散的フーリエ変換して、出力信号(y (S) )(
S=0.1.2.・・・・)を得る。これも式で書くと
、以下のようになる。
2π R’ =Rかつスペクトラムを操作しないときは、入力
信号がそのまま出力信号にならねばならない。
そのためには、上式より、 y (S) =x (S) 1m=  60@= −00 ところで、 2π であるからz=s−pM(p:変数)とおくと故に、(
h (m) )と(f (m) )とが、全てのSにつ
いて、 ・・・・(14) となることが必要である。
さて、(12)式より、 X (d’ 、 k)の逆離散的フーリエ変換をx (
mR’ +S)と書くと、 (S=0.1.2.・・・・) (f (m) )はm−0,1,2,・・・・、ト1で
のみ0でないので f (S−+*R’)・f (mR’ +S)    
       1は、S”mR’ + mR’ +l、
  ・・・・、d’+M−1(n =S−mR’ I 
n =(L1+” ” + M−1)の部分だけが0で
ない。したがって、R′として、r−R’=m(r:正
の整定数)と、Mを割り切るように選ぶと、 (m−1)R’+M≦S≦mR’+M−1(m=0.1
.2.・・・・) と、有限回の加算で(y (S) 1  (S=0.1
,2.・・・・)が逐次求まる。
第4図において具体的に述べる。なお以下の説明ではR
’=64とする。
スペクトル処理部(23)の複素乗算回路(237)よ
りの複素データはlワードずつ逆FFT変換器(24)
に供給される。
逆FFT変換器(24)では、こうして送りこまれる実
部、虚部ともに16ビツトよる成るデータが256ワー
ドになると、このデータに対し、逆離散的フーリエ変換
がおこなわれ、1ワード16ビツトから成る256ワー
ドの時間領域のデータが生成される。この1ワードL6
ビツトから成る256ワードのデータは、クロック発生
回路(25)よりの周期100 n secのクロック
CK4のタイミングで、16ビツトより成る2つの入力
端子、および12ビツトより成る1つの出力端子を有す
る乗算回路(26)の一方の入力端子へおくりこまれる
一方、この同じクロックCK4のタイミングで、乗算回
路(26)のもう一方の入力端子へ、あらかじめROM
(27)に用意されている、上述した関係式(14)式
を満足する係数、 m = 0.1.2.= ・・、 255がm−011
,2,・−・・の順に1ワードずつ、送りこまれ、この
2つの入力の積が、乗算回路(26)の出力として、入
力データがセットされてから100 n sec後に、
乗算回路(26)の出力端子にセットされる。
そして、この乗算回路(26)の出力は、同じく周期1
00 n secのクロックによって、■ワード12ビ
ット、256ワ一ド分の容量を有するシフトレジスタ(
28)に1個ずつ順次送り込まれる。
こうして・シフトレジスタ(28)に256ワードの乗
算結果が送り込まれると、この256ワードのデータは
−このシフトレジスタ(28)と同じ構成のシフトレジ
スタ(29)の256ワードのデータと、同じ番地のも
の同志毎に加算され、その加算結果がシフトレジスタ(
29)の同じ番地に書き込まれて、シフトレジスタ(2
9)に256個の新しいデータが作られる。つまり、こ
れによりオーバーラツプ加算がなされる。
すなわち、逆FFT変換器(24)の出力は時間軸上で
は第4図Aに示すように順次時間長L−Rずつ互いにオ
ーバーラツプしたような信号であるが、これが順次加算
されて第4図Bに示すような信号が形成される。なお、
この第4図は説明の便宜上アナログの状態で示した。
シフトレジスタ(29)は、その後、周期100 n5
ecのシフトクロックで1ワードずつシフトされ、その
始めのO番地〜63番地の64個のデータが、1ワード
12ビツト、64ワードの容量のシフトレジスタ(30
)に転送される。このシフトレジスタ(29)の64ワ
ードのシフトにより空いた192番地〜255番地には
“0”データが入れられる。
シフトレジスタ(30)の64ワードのデータは、分周
回路(17)よりのクロックCK2によって、シフトレ
ジスタ(30)と同じ構成のシフトレジスタ(31)に
ラッチされる。このシフトレジスタ(31)にラッチさ
れた64ワードのデータは、クロック発生回路(15)
よりの6.4kHzのクロックC)hにより先頭(θ番
地)から順に1ワードずつ12ビツトのD/Aコンバー
タ(32)に送り込まれてアナログ出力にされる。そし
て、このアナログ出力はカットオフ周波数3.2kHz
のローパスフィルタ(33)を通されて、最終的なアナ
ログ電気信号が出力端子(34)に導出される。
前述したように、この出力端子(34)に得られる信号
は、言語情報の明瞭度が向上し、また、もとの情報部分
を失うことなくノイズが低減されたものとなる。   
                     1なお、
この例ではスペクトラム領域で処理したスペクトラムに
基づいて時間領域の信号を作成するに際し、5TFTに
よる合成アルゴリズムを用いているので、離散的フーリ
エ変換のブロック的な処理に伴なうブロック間の信号の
不連続を避けることができる。
なお、フーリエ変換の代わりにウオルシュ変換を行ない
、スペクトル処理部(23)においてその変換出力の実
部の絶対値をとってパワー算出を行った後、パワー強調
するとともに、上記実部の正。
負の符号を算出し、その算出符号を上記強調した出力に
付加するような構成であってもよい。
また、パワースペクトラム強調の方法としては、要はス
ペクトラム包絡の山、谷のピークを強調できればよいの
で、上記の例のようにべき乗する方法のみではなく、例
えばパワースペクトラムを定数倍してもよく、また、パ
ワースペクトラムをケプストラム分析し、低次の係数を
強調し、高次を抑圧するようにしてもよく、その他種々
の方法がとり得る。
H発明の効果 言語情報は、スペクトルの振幅成分の包路線の山、谷の
位置と大きさかになっているが、この発明によれば、そ
のスペクトル包絡の山、谷が強調されるので、言語情報
の明瞭度が向上する。
また、スペクトルの山、谷のピークの差がスペクトル強
調により広がることにより、ノイズ部分のみのレベルが
小さくなり、「情報部分」を失うことなく、ノイズ低減
が可能となるものである。
【図面の簡単な説明】
第1図はこの発明装置の一例のブロック図、第2図はこ
の発明装置の一例の具体的実施例のブロック図、第3図
及び第4図はその一部動作の説明のための図、第5図〜
第7図はその説明のための図である。 (3)は直交変換回路、(4)はスペクトル処理部、(
5)は逆直交変換回路である。 ′ニーf−続?1ilt正書 昭和60都19月21日 特許庁長官  宇 賀 道 部   殿−1、事件の表
示 昭和60年 特 許 願 第129696号2°9t 
T!Q (7)81?r、    、−ゆいい3、補正
をする者 事件との関係   特許出願人 住 所 東京部品用2北品用6丁目7番35号名称(2
18)ソニー株式会社 代表取締役 大 賀 典 雄 4、代理人 住 所 東京都新宿区西新宿1丁目8番1号置 03−
343−5821&I5  (新組ビル)明   細 
  書(訂正) 発明の名称  信号処理装置 特許請求の範囲 (a)  入力信号に対し直交変換を施す直交変換手段
と、 (bl  この直交変換手段の出力信号から上記入力信
号のスペクトル強度を算出しその算出したスペクトル強
度を強調するスペクトル処理手段と、(0)  このス
ペクトル処理手段の出力信号を逆直交変改する手段とか
ら成る信号処理装置。 発明の詳細な説明 以下の順序でこの発明を説明する。 A 産業上の利用分野 B 発明の概要 C従来の技術 D 発明が解決しようとする問題点 E 問題点を解決するための手段(第1図)F 作用 G 実施例(第2図) G1短時間フーリエ解析の説明 (第3図、第5図、第6図) G2スペクトル処理部(23)の説明(第7図)G3短
時間フーリエ解析の逆演算の説明(第4図) H発明の効果 A 産業上の利用分野 この発明はノイズ成分を含む音声信号や映像信号の信号
強調及びノイズリダクションを行なう信号処理装置に関
する。 B 発明の概要 この発明はノイズ成分を有する音声信号や映像信号に直
交変換を施こし、得られた成分のダイナミックレンジを
拡大する非線形処理を行ない、これを逆直交変換によっ
て元の時間軸上に戻すようにしたもので、これにより信
号成分の強調及びノイズの低減を図つたものである。 C従来の技術 ノイズ成分を有する音声信号や映像信号の明瞭度の向上
、ノイズの低減を図る場合、従来量も良(使用されるの
は周波数軸上のフィルタリング処理によって、信号成分
がノイズ成分に比して多い周波数帯域では利得を増加さ
せ、ノイズ成分が主となっている周波数帯域では利得を
低減させる方法である。 この方法を実施するには、従来、信号の全周波数帯域を
対数軸上で10〜20等分した例えばバンドパスフィル
タバンクを使用することが主であった。 D 発明が解決しようとする問題点 ところが、上述のような方法を用いた場合には、時間的
に変化している信号スペクトルに対し、固定した通過周
波数のフィルタを用いることになり、大まかな調整しか
できないことと相俟って信号そのものを低下させてしま
うことも多く、明瞭度。 ノイズ低減の向上はあまり望むことができなかった。 
                         
1E 問題点を解決するための手段 この発明は上記の欠点を改善するため、以下のように構
成する。 すなわち、第1図はこの発明装置の一例で、(1)は音
声信号又はビデオ信号の入力端子、(2)はA/Dコン
バータ、(3)はフーリエ変換等の直交変換回路、(4
)はスペクトル強度算出回路(41)及びスペクトル強
度強調回路(42)からなるスペクトル処理部、(5)
は逆フーリエ変換等の逆直交変換回路、(6)はこの逆
直交変換回路(5)よりのデジタル出力をアナログ信号
に戻すD/Aコンバータ、(7)は出力端子である。 F 作用 入力端子(1)を通じた音声信号又は映像信号はA/D
コンバータ(2)にてデジタル信号に変換された後、直
交変換回路(3)に供給される。 この直交変換回路(3)においては例えばフーリエ変換
されて時間軸が周波数軸に変換されたスペクトルが形成
される。 この直交変換回路(3)の出力はスペクトル処理部(4
)のスペクトル強度算出回路(41)において例えば絶
対値演算がなされてスペクトル強度が算出される。 算出されたスペクトル強度はスペクトル強度強調回路(
42)に供給されて、スペクトルの振幅成分の包路線す
なわちスペクトル強度の山と谷とが強調される。 この強調回路(42)の出力は逆直交変換回路(5)に
供給されて例えば逆フーリエ変換されて周波数軸が時間
軸に戻される。 そして、この時間軸に戻された信号がD/Aコンバータ
(6)によってアナログ信号に戻され、出力端子(7)
に導出される。 言語情報は短時間スペクトルの振幅成分のスペクトル包
路線の山、谷の位置と大きさが担っているので、上記の
ようなスペクトル強調によって言語情報の明瞭度が向上
する。 また、スペクトルがノイズに汚されていた場合、ノイズ
に汚されたスペクトルの谷は、信号のスペクトルがノイ
ズのスペクトルにうずもれてしまった部分と考えられ、
またスペクトルの山はノイズに汚されつつも、なお、信
号のスペクトルの特徴を有している部分と考えられる。 したがって、スペクトル強調されてスペクトルの山と谷
のピークの差が広がる(ダイナミックレンジが広がる)
ことによって、ノイズ部分のみレベルが少なくなったこ
とになり、もとの情報信号を失うことなく、ノイズ低減
が可能になる。 G 実施例 第2図はこの発明の一実施例を示すもので、この例では
スペクトラム領域で処理したスペクトラムに基づいて時
間領域の信号を作成するに際し、5TFT (Shor
t Ttme Fourier Transform)
  (IHEETRANSACTIONS ON AC
OUSTICS、5PEECIl、AND 5IGNA
LPROCESSING、VOL、ASSP−28,N
O,1,FBBRUARY 1980P、99〜P、1
02参照)による合成アルゴリズムを用いている。 同図において、入力音声はマイクロホン(11)及びア
ンプ(12)によって電気信号に変換され、これがロー
パスフィルタ(13)に供給されて帯域が例えば3.2
kHzに制限される。このローパスフィルタ(13)を
通った信号はA/Dコンバータ(14)に供給される。 このA/Dコンバータ(14)にはクロック発生回路(
15)よりの5.4kHzのサンプリングクロックCK
1が供給されてアナログ信号が1ワード12ビツトのデ
ジタル信号に変換される。このデジタル信号はシフトレ
ジスタ(16)に、クロック発生回路(15)よりの6
.4kHzのシフトクロックC1hで順次書き込まれる
。この場合、このシフトレジスタ(16)は256ワ一
ド分の容量を有する。 すなわちシフトレジスタ(16)には、A/Dコンバー
タ(14)によって生成された、一連の256ワードの
デジタルデータがはいっており、A/Dコンバータ(1
4)が、デジタルデータを1語、生成するごとに、シフ
トレジスタ(3)は、1語、右にシフトされ、その内容
が更新されてゆく。 シ G1短時間フーリエ解析の説明 ここで、第2図におけるシフトレジスタ(16)以下の
信号の具体的な流れについて説明する前に、短時間フー
リエ解析について、一般的な事柄を述べておく。 例えば、「あ°いうえお」という音声信号を考えてみる
と、「あ」という音が発せられている時間と、「い」と
いう音が発せられている時間とでは、音声を発している
ヒトの口や声道の形状が異なっている。すなわち「あい
うえお」という音声信号は、時間とともにその特性が変
化してゆく物理的実体から発せられた信号であり、定常
信号とは見なせない。 このように、音声信号や音楽信号などは、それを発して
いる物理的実体の特性が、時間とともに変化しており、
一般に定常信号と見なすことはできず、定常信号を対象
にしたフーリエスペクトラム解析を直接に通用すること
は不可能である。しかしながら、先はどの例の「あいう
えお」について言うと、「あ」、「い」、「う」、「え
」。 「お」の各々の音声を発している時間内では、ヒトの口
や声道の形状は、はぼ一定しており、その時間内に信号
を限定すれば、定常信号と見なせる。 そこで、フーリエ変換する領域を、定常と見なせる時間
の区間に限定してフーリエ変換をおこない、その区間を
次々に更新してゆき、得られるフーリエスペクトラムを
用いれば、非定常ではあるが、短時間の区間については
定常であるような、音声信号や音楽信号に対してフーリ
エ解析が可能になる。 このようなフーリエ解析は、短時間フーリエ解析と呼ば
れている。 数式を用いてさらに説明しよう。入力信号x (t)を
サンプリングして得られるデータ列を(X(ホ))(m
=o+1+2+・・・・)としたとき、上述した事柄は
、定常とみなせるデータの部分列(x (m+SR) 
)(m=(L1+””M ; S−0,L””・R,R
及びMはある整定数)の変数mについて、有限の部分列
(x (m+sR) )  (m=0.1.”、 M−
1)の端部がスペクトルに及ぼす影響を減じる窓係数(
h(−m) )  (m=0.i、・・・・、 M−1
)を乗じた後、変数mについて離散的フーリエ変換をお
こない、短時間フーリエスペクトラムX (SR,k)
  (S=0.1.・・・・; k =0.1.2.・
・・・、M−1)を得る、ということになる。 9π 第5図より明らかなように、Rは分析する区間の更新量
であり、以下のような制約がある。 (1)式より 2π m + SR= fとおくと 2π 窓係数(h (−m) )  (m−0,1,2,・・
・−、M−1)の定義を、mについて一■〜+■まで拡
大して、とすると 2π すなわち、X(SR,k)は、第6図に示すようにデー
タ列 (h (m) ) とを、たたみ込んだデータ列、X(
S、k)(S=0.1.2.・・・・)を第1番目の変
数についてR−1データおきに再サンプリングしたもの
になっており、デジタル信号 ンバルスレスポンス(h (m) )を有する線形デジ
タルシステムに入力した出力を、R−1データおきに再
サンプリングしたものと解釈できる。 故に、分析する区間の更新量RXIは、サンプでなけれ
ばならない。 (X (+m、k) )  (m=0.1.2.・・・
・)の帯域幅は、(m=0.1.2.・・・・)に依存
するわけであるが、その上限は、図に於ける、インパル
スレスポンス(h (m) )を有する線形デジタルシ
ステムの口〕 すなわちRは、 ・・・・・(5) でなければならない。 一例として、M=256. (h (−m) )として
ハミング窓係数とすると窓係数 h  (−m)  =0.54−0.46xcos  
(2πm/255)(m=0.1.・・・・、  25
5 )を用いるとすると、(h (−m) )  (m
=0.1.2゜・・・・、255)のローパス部分の帯
域幅は、約42dBまで減衰する部分までをとることに
すると、−になる。したがって、Rは、上式の関係から
、R≦□=64 でなければならない。 第4図において、シフトレジスタ(18)以降で上述し
た、短時間フーリエ変換をおこなっている。 M=256、分析窓係数として、ハミング窓係数h (
m) −0,540,46Xcos  (2πm/25
5)(m = 0.1.2.・・・・、 255 ) 
、R= 64としている。 上述の例で明らかなように、R=64は、(5)式を満
たしている。 以下、具体的に述べる。 1ワード12ビツト、256ワードより成るシフトレジ
スタ(16)の内容は、A/D変換器(14)の駆動ク
ロックCKzを分周回路(17)で64分周したクロッ
クCK2の1パルス(すなわち、64X CA/D変換
(14)の駆動クロック周期、約158μsec )(
秒))ごとに、同じく1ワード12ビツト、256ワー
ドよりなるシフトレジスタ(18)にラッチされる。ラ
ッチされた256ワードのデータは、クロック発生回路
(工9)よりの10MHz (周期100 n sec
 )のクロック(J3のタイミングで、1ワードずつ図
中右ヘシフトされ、12ビツトより成る2つの入力端子
、および23ビツトより成る1つの出方端子を有する乗
算器(20)の一方の入力端子におくりこまれる。一方
、この同じクロックCK3のタイミングで、乗算器(2
0)のもう一方の入力端子に、あらかじめROM(21
)に貯えであるハミング窓係数h (−m) =0.5
4−0.46cos (2ycm/255 )(m−0
,1,2,・・・・、 255 )が、−語ずつ、m 
= Q。 1.2.・・・・の順に、おくりこまれ、この2つの入
力の積が、乗算器(20)の出力として、入力データが
セットされてから100 n sec後に、乗算器(2
o)の出力端子にセットされる。 この、乗算器(20)の23ビツトより成る出力結果は
、乗算器(20)に入力データを送りこむタイミングク
ロックのタイミングで(すなわち、100n secご
とに) F F T (Fast Fourier T
ransform)変換器(22)へ送りこまれる。F
FT変換器(22)は、こうして送りこまれる1ワード
23ビツトのデータが256ワードになると、このlワ
ード23ビツト、256ワードのデータに対して、FF
Tをおこない、実部、虚部ともに16ビツトから成る2
56ワードの複素データを生成する。 すなわち、マイクロホン(11)に第3図Aに示すよう
な信号が供給されると、同図Aに示すように所定時間り
分ずつ、所定時間長L−R分だけ前の信号とオーバーラ
ツプして信号が抽出される。 換言すれば時間R毎に時間長り分ずつ信号がA/Dコン
バータ(14)の出力より抽出されてシフトレジスタ(
18)の出力に得られる。そしてこの抽出された信号は
フーリエ変換されて第3図Bに示すように時間軸が周波
数軸に変換されたスペクトラムが形成される。 なお、第3図は説明の便宜上アナログで示した。 G2スペクトル処理部(23)の説明 このFFT変換器(22)よりの256個の複素スペク
トラムデータCC1)  (1=0.1,2.・・・・
、255)はスペクトル処理部(23)に供給される。 スペクトル処理部(23)では複素スペクトラムCC1
>が絶対値計算回路(231)に供給されてスペクトル
強度が計算される。 すなわち、複素スペクトラムC(It”)のうち信号成
分を S (1)  =S (j2) R+jS(1) +ノ
イズ成分を n (jり =n (ffi) Ft+jn(1) I
とすると、複素スペクトラムc <pt>は、C(Q)
= (S(12)R+ n(jりR) + j  (S
(12)+  + nfJり+ )となり、スペクトル
強度CA(n)は、CA(12) = l C02) 
l = ((S(す& + 5(42)+2) + (n(
J2)y? + n(Q)+2)+2  (n(jりR
H5cc)、   +  n(Q)夏   ・ 5(3
2)yc  )   )’・・・・(6) この値CA(42)は各々16ビツトから成る。 この計算結果は対数計算回路(232)に供給され、こ
れにおいて、 CB (jり =  log (cA(11))  C
I =0.1.2.・・・・255 )・・・・(7) が計算される。CB(jりも各々16ビツトから成る。 この対数計算回路(232)の出力はべき乗計算回路(
233)に供給され、予めROM(234)に設定され
るべき乗の値によりべき乗計算される。 この例ではべき乗の値は1.2とされ、CC(jf! 
) = (cBCQ)) 1=2        ・・
・・(8)なる計算がなされて16ビツトのデータCC
(j)が得られる。 このデータcc(1)は次にeX計算回路(235)に
供給され、 CD (j! ) = exp (cIJ))    
    ・・・・(91なる計算がなされて、16ビツ
トのデータCD(j’)が得られる。 また、以上と並行してFFT変換器(22)からのデー
タC(β)は位相算出回路(236)に供給されて、こ
の位相算出回路(236)において、j=i J=0.
1.2.・・・傷 ・・・・α呻が計算される。この位
相データCP(jりは実部、虚部ともに16ビツトから
なる複素データである。 こうしてe X計算回路(235)及び位相算出回路(
236)より得られたデータCD(1)及びCP(j2
)は、各々、f=0.1,2.・・・・の順に複素乗算
回路(237)に供給されて、実部、虚部ともに16ビ
ツトからなる乗算出力が得られる。 以上のようにスペクトル処理部(23)では入力信号の
短時間スペクトルの対数振幅成分が1.2乗されている
。このようにされると、第7図Aの入力信号のスペクト
ルは同図Bに示すように、その対数振幅成分の山と谷の
各々のピークの差が広がり、スペクトラムの山、谷が強
調されることになる。すなわち、スペクトラムのダイナ
ミ・νクレソンが広がることになる。 その結果、以下のような効果が得られることになる。 すなわち、一般的に「ア」とか「イ」というような言語
情報は(短時間)スペクトルの振幅成分の包路線の山、
谷の位置と大きさが担っているわけであるが、そのスペ
クトル包絡の山、谷が強調されることから言語情報の明
瞭度が向上するものである。 また、スペクトラムがノイズに汚されている場合を考え
てみると、ノイズに汚されたスペクトルの谷は、信号の
スペクトラムがノイズのスペクトラムに埋もれてしまっ
た部分、また山はノイズに汚されつつも、なお、信号の
スペクトラムの特徴を有している部分と考えられる。し
たがって、スペクトルの山、谷のピークの差が広がる(
ダイナミンクレンジが広がる)ことによってノイズ部分
のみのレベルが小さくなり、元の「情報部分」を失うこ
となく、ノイズ低減が可能となるものであ     す
る。 G3短時間フーリエ解析の逆演算の説明以上のようなス
ペクトル処理部(23)の出力は順次逆FFT変換器(
24)に供給される。そして、この逆FFT変換器(2
4)及びそれ以降の回路によりスペクトル処理部(23
)よりの複素データは時間領域の信号に戻される。これ
らFFT変換器(24)以降の回路について説明する前
に、これらに関しての一般的な関係について述べておく
。 先に述べたように、変形された短時間フーリエスペクト
ラム’R(SR,k)(S=0.1.2.・・・・;に
=0.1,2.・・・・、ト1)は、短時間フーリエス
ペクトラム全(S、k)  (S=0.1.2.・・・
・i k = 0.1,2゜・・・・、ト1)を、第1
番目の変数Sについて、R−1データおきに再サンプリ
ングしたものである。 そこで、変形された短時間フーリエスペクトラム△ X (SR,k)  (S=0.1.2.・・・・、 
 k=0.1,2.・・・・。 八 M−1)から、時間領域の信号を作成するには、X(S
R,k)  (S=0.1.2.・・・・;  k=o
、1,2.・・・・。 ^ M−1)を補間して、X (S、k)  (S=0.1
,2.・・・・;^ に=0.1,2.・・・・、ト1)を作り、X (S、
k)  (S−0,1,2,・・・・;  k=0.1
,2.・・・・、ト1)を逆離散的フーリエ変換すれば
良い。すなわち、’& (SR。 k)の第1番目の変数に関して、各々、隣りのデータの
間に0をR−1個つめたデータX (S、k) 。 すなわち、 を作り、M個のデータ(f  (m) )  (m=0
.1.・・・・、ト1)をインパルスレスポンスとして
持つローパスフィルタに通して、X(S、k)を作る。 式X(lk)の定義より 一= −■ △ この後、X(S、k)を第2番目の変数kに関して、逆
離散的フーリエ変換して、出力信号(y (S) )(
S=0.1.2.・・・・)を得る。これも式で書くと
、以下のようになる。 2π スペクトラムを操作しないときは、入力信号がそのまま
出力信号にならねばならない。そのためには、上式より
、 x (S) =y (S) ところで、 であるから1=S−pM(p:整数である変数)とおく
と 故に、(h (m) )と(f (m) )とが、全て
のSについて、 ・・・・(13) となることが必要である。 さて、(11)式より、 △ X(mR,k )の逆離散的フーリエ変換をx (mR
,S)と書くと、 m=−■ (S=0.1,2.・・・・) (f(m))はm =0. L 2. ++ ・+ +
 n−tでのみOでないので f  (S−mR)  ・x (mR,S)は、S=m
R,mR+ 1.・・・・、mR+M−1の部分だけが
0でない。したがって、Rとして、r−R=M (r 
:正の整定数)と、Mを割り切るように選ぶと、 (m+r−1)R≦S≦ (m+R)R−1(m=0+
L2+・・・・) と、有限回の加算で(y (S) )  (S=0.1
,2.・・・・)が逐次求まる。これをオーパーラ・ノ
ブ加算という。 第4図において具体的に述べる。なお以下の説明ではR
=64とする。 スペクトル処理部(23)の複素乗算回路(237)よ
りの複素データは1ワードずつ逆FFT変換器(24)
に供給される。 逆FFT変換器(24)では、こうして送りこまれる実
部、虚部ともに16ビツトよる成るデータが256ワー
ドになると、このデータに対し、逆離散的フーリエ変換
がおこなわれ、1ワード16ビツトから成る256ワー
ドの時間領域のデータが生成される。この1ワード16
ビツトから成る256ワードのデータは、クロック発生
回路(25)よりの周期100 n secのクロック
CK4のタイミングで、16ビツトより成る2つの入力
端子、および12ビツトより成る1つの出力端子を有す
る乗算回路(26)の一方の入力端子へおくりこまれる
。 一方、この同じクロックCK4のタイミングで、乗算回
路(26)のもう一方の入力端子へ、あらかじめROM
(27)に用意されている、上述した関係式(14)式
を満足する係数、 m = 0.1.2.・・= 、 255がm = 0
.1.2.− =の順に1ワードずつ、送りこまれ、こ
の2つの入力の積が、乗算回路(26)の出力として、
入力データがセ・ツトされてから100 n sec後
に、乗算回路(26)の出力端子にセットされる。 そして、この乗算回路(26)の出力は、同じく周期1
00 n secのクロックによって、1ワード12ビ
ツト、256ワ一ド分の容量を有するシフトレジスタ(
2日)に1個ずつ順次送り込まれる。 こうして、シフトレジスタ(28)に256ワードの乗
算結果が送り込まれると、この256ワードのデータは
、このシフトレジスタ(28)と同じ構成のシフトレジ
スタ(29)の256ワードのデータと、同じ番地のも
の同志毎に加算され、その加算結果がシフトレジスタ(
29)の同じ番地に書き込まれて、シフトレジスタ(2
9)に256個の新しいデータが作られる。つまり、こ
れによりオーバーラツプ加算がなされる。 すなわち、逆FFT変換器(24)の出力は時間軸上で
は第4図Aに示すように順次時間長L−Rずつ互いにオ
ーバーラツプしたような信号であるが、これが順次加算
されて第4図Bに示すような信号が形成される。なお、
この第4図は説明の便宜上アナログの状態で示した。 シフトレジスタ(29)は、その後、周期100nse
cのシフトクロックで1ワードずつシフトされ、その始
めの0番地〜63番地の64個のデータが、1ワード1
2ビツト、64ワードの容量のシフトレジスタ(30)
に転送される。このシフトレジスタ(29)の64ワー
ドのシフトにより空いた192番地〜255番地には“
θ″データ入れられる。 シフトレジスタ(30)の64ワードのデータは、分周
回路(17)よりのクロック−CK2によって、シフト
レジスタ(30)と同じ構成のシフトレジスタ(31)
にラッチされる。このシフトレジスタ(31)にラッチ
された64ワードのデータは、クロック発生回路(15
)よりの6.4kHzのクロックCLにより先頭(0番
地)から順に1ワードずつ12ビツトのD/Aコンバー
タ(32)に送り込まれてアナログ     1出力に
される。そして、このアナログ出力はカットオフ周波数
3.2kHzのローパスフィルタ(33)を通されて、
最終的なアナログ電気信号が出力端子(34)に導出さ
れる。 前述したように、この出力端子(34)に得られる信号
は、言語情報の明瞭度が向上し、また、もとの情報部分
を失うことなくノイズが低減されたものとなる。 なお、この例ではスペクトラム領域で処理したスペクト
ラムに基づいて時間領域の信号を作成するに際し、5T
FTによる合成アルゴリズムを用いているので、離散的
フーリエ変換のブロック的な処理に伴なうブロック間の
信号の不連続を避けることができる。 なお、フーリエ変換の代わりにウオルシュ変換を行ない
、スペクトル処理部(23)においてその変換出力の絶
対値をとった後、スペクトル強調するとともに、上記出
力の正、負の符号を算出し、その算出符号を上記強調し
た出力に付加するような構成であってもよい。 また、スペクトル強度強調の方法としては、要はスペク
トラム包絡の山、谷のピークを強調できればよいので、
上記の例のようにべき乗する方法のみではなく、例えば
スペクトル強度を定数倍してもよく、また、スペクトル
強度をケプストラム分析し、低次の係数を強調し、高次
を抑圧するようにしてもよく、その他種々の方法がとり
得る。 H発明の効果 言語情報は、スペクトルの振幅成分の包路線の山、谷の
位置と大きさが担っているが、この発明によれば、その
スペクトル包絡の山、谷が強調されるので、言語情報の
明瞭度が向上する。 また、スペクトルの山、谷のピークの差がスペクトル強
調により広がることにより、ノイズ部分のみのレベルが
小さくなり、「情報部分」を失うことなく、ノイズ低減
が可能となるものである。 図面の簡単な説明 第1図はこの発明装置の一例のブロック図、第2図はこ
の発明装置の一例の具体的実施例のブロック図、第3図
及び第4図はその一部動作の説明のための図、第5図〜
第7図はその説明のための図である。 (3)は直交変換回路、(4)はスペクトル処理部、(
5)は逆直交変換回路である。

Claims (1)

  1. 【特許請求の範囲】 (a)入力信号に対し直交変換を施して、時間軸を周波
    数軸に変換する直交変換手段と、 (b)この直交変換手段の出力よりそのパワースペクト
    ルを算出し、その算出したパワースペクトルを強調する
    スペクトル処理手段と、 (c)その強調した出力を逆直交変換する手段とからな
    る信号処理装置。
JP60129696A 1985-06-14 1985-06-14 信号処理装置 Pending JPS61286900A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60129696A JPS61286900A (ja) 1985-06-14 1985-06-14 信号処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60129696A JPS61286900A (ja) 1985-06-14 1985-06-14 信号処理装置

Publications (1)

Publication Number Publication Date
JPS61286900A true JPS61286900A (ja) 1986-12-17

Family

ID=15015935

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60129696A Pending JPS61286900A (ja) 1985-06-14 1985-06-14 信号処理装置

Country Status (1)

Country Link
JP (1) JPS61286900A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62235996A (ja) * 1986-04-07 1987-10-16 東洋通信機株式会社 合成音質変化方法
JP2006010907A (ja) * 2004-06-24 2006-01-12 Yamaha Corp 音声効果付与装置及び音声効果付与プログラム
JP2006178333A (ja) * 2004-12-24 2006-07-06 Nippon Telegr & Teleph Corp <Ntt> 近接音分離収音方法、近接音分離収音装置、近接音分離収音プログラム、記録媒体
JP2008176132A (ja) * 2007-01-19 2008-07-31 Casio Comput Co Ltd 音声合成辞書構築装置、音声合成辞書構築方法、及び、プログラム
JP2013250380A (ja) * 2012-05-31 2013-12-12 Yamaha Corp 音響処理装置
WO2015129465A1 (ja) * 2014-02-28 2015-09-03 独立行政法人情報通信研究機構 音声明瞭化装置及びそのためのコンピュータプログラム

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62235996A (ja) * 1986-04-07 1987-10-16 東洋通信機株式会社 合成音質変化方法
JP2006010907A (ja) * 2004-06-24 2006-01-12 Yamaha Corp 音声効果付与装置及び音声効果付与プログラム
JP4654615B2 (ja) * 2004-06-24 2011-03-23 ヤマハ株式会社 音声効果付与装置及び音声効果付与プログラム
JP2006178333A (ja) * 2004-12-24 2006-07-06 Nippon Telegr & Teleph Corp <Ntt> 近接音分離収音方法、近接音分離収音装置、近接音分離収音プログラム、記録媒体
JP4533126B2 (ja) * 2004-12-24 2010-09-01 日本電信電話株式会社 近接音分離収音方法、近接音分離収音装置、近接音分離収音プログラム、記録媒体
JP2008176132A (ja) * 2007-01-19 2008-07-31 Casio Comput Co Ltd 音声合成辞書構築装置、音声合成辞書構築方法、及び、プログラム
JP2013250380A (ja) * 2012-05-31 2013-12-12 Yamaha Corp 音響処理装置
WO2015129465A1 (ja) * 2014-02-28 2015-09-03 独立行政法人情報通信研究機構 音声明瞭化装置及びそのためのコンピュータプログラム
JP2015161911A (ja) * 2014-02-28 2015-09-07 国立研究開発法人情報通信研究機構 音声明瞭化装置及びそのためのコンピュータプログラム
US9842607B2 (en) 2014-02-28 2017-12-12 National Institute Of Information And Communications Technology Speech intelligibility improving apparatus and computer program therefor

Similar Documents

Publication Publication Date Title
Smith et al. PARSHL: An analysis/synthesis program for non-harmonic sounds based on a sinusoidal representation
Verfaille et al. Adaptive digital audio effects (A-DAFx): A new class of sound transformations
US4066842A (en) Method and apparatus for cancelling room reverberation and noise pickup
CN111739544B (zh) 语音处理方法、装置、电子设备及存储介质
Tarr Hack Audio: An Introduction to Computer Programming and Digital Signal Processing in MATLAB
JP3430985B2 (ja) 合成音生成装置
JPH07152379A (ja) ディジタル音程変換における不連続点の改善処理方法およびその装置
JPS61286900A (ja) 信号処理装置
JP2001356799A (ja) タイム/ピッチ変換装置及びタイム/ピッチ変換方法
JP2002175099A (ja) 雑音抑制方法および雑音抑制装置
JPS61289734A (ja) 信号処理装置
Lin et al. High quality and low complexity pitch modification of acoustic signals
JP5163606B2 (ja) 音声分析合成装置、及びプログラム
Hanna et al. Time scale modification of noises using a spectral and statistical model
Haghparast et al. Real-time pitchshifting of musical signals by a time-varying factor using normalized filtered correlation time-scale modification (NFC-TSM)
US20050259833A1 (en) Frequency responses, apparatus and methods for the harmonic enhancement of audio signals
JP4170459B2 (ja) 波形信号の時間軸圧縮伸長装置
JPH06175691A (ja) 音声強調装置と音声強調方法
JPS61187000A (ja) 音声のピツチ周波数抽出装置
JP3105721B2 (ja) 音響変換装置
Favreau Phase vocoder applications in GRM tools environment
Zhang “Shimmer” Audio Effect: A Harmonic Reverberator
JPH05273981A (ja) 電子楽器
CN115691522A (zh) 一种重低音增强方法、系统、设备及存储介质
JPS60130908A (ja) グラフイツクイコライザ