JPS59195287A - Voice analyzer - Google Patents

Voice analyzer

Info

Publication number
JPS59195287A
JPS59195287A JP58069475A JP6947583A JPS59195287A JP S59195287 A JPS59195287 A JP S59195287A JP 58069475 A JP58069475 A JP 58069475A JP 6947583 A JP6947583 A JP 6947583A JP S59195287 A JPS59195287 A JP S59195287A
Authority
JP
Japan
Prior art keywords
walsh
transformer
walshy
transform
spectrum
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP58069475A
Other languages
Japanese (ja)
Other versions
JPH0219478B2 (en
Inventor
誠夫 亘理
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP58069475A priority Critical patent/JPS59195287A/en
Publication of JPS59195287A publication Critical patent/JPS59195287A/en
Publication of JPH0219478B2 publication Critical patent/JPH0219478B2/ja
Granted legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
(57) [Summary] This bulletin contains application data before electronic filing, so abstract data is not recorded.

Description

【発明の詳細な説明】 本発明は簡易形音声分析装置の改良に関する。[Detailed description of the invention] The present invention relates to an improvement in a simplified speech analysis device.

通常、音声認識装置では、音声波形を分析し、その分析
出力である特徴パラメータの時系列とあらかじめ記憶さ
れているパターンとの間で識別計算を行い、認識結果を
求めている。
Normally, a speech recognition device analyzes a speech waveform and performs discrimination calculation between a time series of characteristic parameters, which is the output of the analysis, and a pre-stored pattern to obtain a recognition result.

従来、この音声認識装置に使用されている音声分析とし
てバンドパスフィルタ分析やケプヌトラム分析や変形ケ
プヌトラム分析があった。
Conventionally, speech analyzes used in this speech recognition device include bandpass filter analysis, cepnutrum analysis, and modified cepnutrum analysis.

音声波は声帯の振動によって励振された声道からの放射
出力であると考えることができ、音声信号G(1)は(
])式のように声道のインパルス化1ft)と音源波形
5(t)の畳み込みで表わされる。
Speech waves can be considered to be the radiation output from the vocal tract excited by the vibration of the vocal cords, and the speech signal G(1) is (
]) It is expressed by the convolution of the vocal tract impulse 1ft) and the sound source waveform 5(t).

G (t) = R,(tl米8 (1・・・・・・・
・・・・・・・・・・・・・・・・・・・・・・・(1
)米は畳み込み操作 (1)式をフーリエ変換すると Gf(wl=Rftw)X 8 f(ロ)・・・・・・
・・・・・・・・・・・・・・・・・・・・・・・・(
2)となる。音源特性Sf(w)は周期的な線スペクト
ラムであシ・声道特性Rf (wl は、音声スペクト
ルOf(w)のエンベロープでアル。このエンベロープ
を得る方法として一定値以上の帯域幅を持ったバンドパ
スフィルタを音声帯域内に複数個並べるバンドパスフィ
ルタ分析がある。一定値以上の帯域幅を持つことにより
音源特性である線スペクトルの影響を弱くし複数個並べ
ることによシ、エンベロープの全体の特性すなわち声道
特性を得ることができていた。
G (t) = R, (tl rice 8 (1...
・・・・・・・・・・・・・・・・・・・・・・・・(1
) Convolution operation When formula (1) is Fourier transformed, Gf (wl = Rftw) x 8 f (b)...
・・・・・・・・・・・・・・・・・・・・・・・・(
2). The sound source characteristic Sf (w) is a periodic line spectrum, and the vocal tract characteristic Rf (wl is the envelope of the voice spectrum Of (w). One way to obtain this envelope is to use a method that has a bandwidth above a certain value. There is a band-pass filter analysis in which multiple band-pass filters are arranged within the audio band.By having a bandwidth above a certain value, the influence of the line spectrum, which is a sound source characteristic, is weakened, and by arranging multiple band-pass filters, the entire envelope can be In other words, we were able to obtain the characteristics of the vocal tract.

ところで、より精密な声道特性を得るためには、バンド
パスフィルタの帯域幅を細くする必要があるが、細くす
ると音源スペクトルである線スペクトルの影響が大きく
表われてくる。このためバンドパスフィルタの帯域ll
@(ハある程度以上Ml+ くすることはできず、バン
ドパスフィルタ分析ではより精密な声道特性を得ること
はできなかった。−万、声道特性と音源特性を分離し、
より精密な声道特性を求める方法としてケプストラム分
析があ、6゜ケプストラム分析では、(2)式をさしに
線変換し、1oglGr(vν)l =log l R
f(w)l +に≧g l S f(w) l−−(3
ン次に逆フーリエ変換によってケプストラムを得る。
Incidentally, in order to obtain more precise vocal tract characteristics, it is necessary to narrow the bandwidth of the bandpass filter, but when the band width is narrowed, the influence of the line spectrum, which is the sound source spectrum, becomes greater. Therefore, the band ll of the bandpass filter
@(Ha) It was not possible to reduce Ml+ beyond a certain degree, and it was not possible to obtain more precise vocal tract characteristics through band-pass filter analysis.
Cepstrum analysis is a method for obtaining more precise vocal tract characteristics. In 6° cepstrum analysis, equation (2) is linearly transformed, and 1oglGr(vν)l = log l R
f(w)l+≧glS f(w)l−-(3
Then, the cepstrum is obtained by inverse Fourier transform.

G c (ql = Rc (ql + S C(q)
 ・・・・・・・・・・・・・・・・・・・・・・・・
・・・・・・・・(4)この(4)式のように、スペク
トラム領域での積がケプストラム領域では和となる。音
源スペクトル8((wl である周期的な線スペクトル
のケアストラム5c(q)は音源の周期Tpの近傍にの
み表われる。
G c (ql = Rc (ql + SC(q)
・・・・・・・・・・・・・・・・・・・・・・・・
(4) As shown in equation (4), the product in the spectral domain becomes the sum in the cepstrum domain. The periodic line spectrum care strum 5c(q), which is the sound source spectrum 8 ((wl), appears only in the vicinity of the period Tp of the sound source.

−万、声道スペクトルRf(w) ハGf(wlのエン
ベロープとして表われ、そのケプストラムT(、c(q
)は低ケフレンシ部へ表われる。すなわち、音声信号を
ケプストラム分析し、クフレンシの低い成分に音源特性
よシ分離された声蓬特性を得ることができる。
−10,000, the vocal tract spectrum Rf(w) appears as the envelope of Gf(wl, and its cepstrum T(, c(q
) appears in the low quefrency area. That is, by performing cepstral analysis on the audio signal, it is possible to obtain vocal characteristics that are separated from the sound source characteristics into components with low frequency.

さらに特願昭56−(169031号明細書(%開割5
7−185098号公報に記載されているように音声の
スペクトルの中より帯域内の周波数成分のみを切出しゼ
ロ周波数までシフトする切出し部を用けることにより、
伝送路の帯域外の特性の影響を除去することができる。
Furthermore, patent application No. 169031 (% cut 5
As described in Japanese Patent No. 7-185098, by using a cutting section that cuts out only the frequency components within the band from the voice spectrum and shifts them to zero frequency,
The influence of out-of-band characteristics of the transmission path can be removed.

また、周波数の高域部を圧縮する写r象関数による周波
数軸のスケール変換例えば11gスケール変換、’Me
l!スケール変換iどを行うスクール変換部を用けるこ
とにより、高域よシ低域へ重みが置かれたすなわち人間
の聴覚特性に近い特性を狩った変形ケプストラムが得ら
れる。
In addition, scale conversion of the frequency axis using a mapping function that compresses the high frequency part, such as 11g scale conversion, 'Me
l! By using a school conversion section that performs scale conversion, etc., a modified cepstrum can be obtained in which weight is placed on the high frequency band and on the low frequency band, that is, the characteristics are close to the human auditory characteristics.

前記スケール変換は第1図に示すような写像関数Sm=
M(Se)により、伝送路の帯域内のみのデータを廟ス
ケールまたはMel!スケールへ並び換えることである
。すなわちBe査目のスペクトルをSm番目の変形スペ
クトルとすることである。
The scale conversion is performed using a mapping function Sm= as shown in FIG.
M(Se) allows data only within the band of the transmission path to be converted to a mausoleum scale or Mel! It is to rearrange to scale. That is, the spectrum of the Be-th scan is set as the Sm-th modified spectrum.

しかしながら、前記のバンドパスフィルタ分析やケプス
トラム分析や変形ケプストラム分析は、フーリエ変換を
基本としており三角関数系との乗算を必要とし装置が大
型となる欠点があった。
However, the aforementioned band-pass filter analysis, cepstrum analysis, and modified cepstrum analysis are based on Fourier transform, and require multiplication with a trigonometric function system, resulting in a large-sized apparatus.

一方、フーリエ変換の近似的な変換であるウオルシュ変
換は±1の2値の直交関数系による変換であるため、ウ
オルシュスペクトルは加減算の与で求めることができる
。このウォルシー変換を用いることによシ特開昭57−
700号公報に記載されているように小型の疑似バンド
パスフィルタを実現することが知られている。しかし疑
似バンドパスフィルタではより細かで精密な声道特性を
得られない欠点があった。
On the other hand, since the Walsh transform, which is an approximation of the Fourier transform, is a transform using a binary orthogonal function system of ±1, the Walsh spectrum can be obtained by addition and subtraction. By using this Walshy transformation, it is possible to
It is known to realize a small pseudo bandpass filter as described in Japanese Patent No. 700. However, the pseudo bandpass filter has the disadvantage that it is not possible to obtain finer and more precise vocal tract characteristics.

本発明の目的は、ケプストラム分析における7−リエ変
換と逆フーリエ変換を共釦つォルンー変換へ置き換える
ことにより、ケプストラムの近似を得る小型の装置、す
なわち、よシ細かで精密な声道特性が得られかつ小屋の
音声分析装置を提供することにある、 本発明による音声分析装置は、入力信号のウォルシー変
換を行う第1のウオルシュ変換部と、前記ウォルシー変
換部の出力よりウォルシーパソースペクトルを求めその
線変換を行う一変換部と、ウォルシー交番数軸のスケー
ル変換を行う写像関数8m=M (s e )によシ前
記線変換部の出力を変形交番数軸へ写像するスケール変
換部と、前記スケール変換部の出力のウォルシー変換を
行う第2のウォルシー変換部を有している。
The purpose of the present invention is to provide a compact device for approximating the cepstrum by replacing the 7-lier transform and inverse Fourier transform in cepstrum analysis with the co-button Worn-transform. An object of the present invention is to provide a speech analysis device for a hut.The speech analysis device according to the present invention includes a first Walsh transform section that performs Walshy transformation of an input signal, and a Walshy-Passault spectrum obtained from the output of the Walshy transform section. a conversion unit that performs the line conversion; a scale conversion unit that maps the output of the line conversion unit to a modified alternating number axis using a mapping function 8m=M (s e ) that performs scale conversion of the Walshy alternating number axis; It has a second Walshy transformer that performs Walshy transform on the output of the scale transformer.

次に本発明で使用するウォルシー変換について説明する
。ウオルシュ変換は(5)式で定義されるが、W″H;
−X・・・・・・・・・・・・・・・・・・・・・・・
・・・・・・・・・・(5)ただし Wけウオルシュス
ペクトル Xは人力列ベクトル Hlはウオルシュ変換行列であシ Hi=Hi−1■H1 1 Hl = () −1 にて求められる。
Next, the Walshy transform used in the present invention will be explained. The Walsh transformation is defined by equation (5), where W″H;
-X・・・・・・・・・・・・・・・・・・・・・
. . . (5) However, the human column vector Hl of the Walsh spectrum X is a Walsh transformation matrix and is determined by the formula Hi=Hi-1 H1 1 Hl = ()-1.

(■はクロネッカ積ン 前記(5)式を高速に計算する方法である尚速クオルン
ユ変換(FWTと略称する)が、昭和51年12月電子
通信学会論文誌Vow 59−A 、I612の第11
34頁より第1135負1での「フーリエ変換とウォル
ンユ変d″に関する一検討」に記載されている。
(■ is the Kronecker product) The fast Kuorunyu transform (abbreviated as FWT), which is a method for quickly calculating the above equation (5), was published in December 1976, Journal of the Institute of Electronics and Communication Engineers Vow 59-A, I612, No. 11.
It is described in ``A Study on Fourier Transform and Worunyu Transform d″'' in No. 1135 Negative 1 from page 34.

入力・5゛イ列に逆2進順に並べた列ベクトルをX。Input: X is a column vector arranged in reverse binary order in a 5-column.

ウオルシュスペクトルをW1変換行列をCとすれば、 FWTは、 W=C−X =Gn−Gn−1・・・G】・X・・・曲・・曲(6)
とn回の行列の積として表現できる。ここで各G1d 
+71 、 +81 、 (91式よシ決定される。
If the Walsh spectrum is W1 and the transformation matrix is C, then the FWT is W=C-X =Gn-Gn-1...G]・X...song...song (6)
It can be expressed as the product of n matrices. Here each G1d
+71, +81, (determined according to formula 91.

Gi=Ei■In−1・・・・・・・・・・・・・・・
・・・・・・・・・曲間・・・曲・(カ2  個   
 2  個 ただしI 山2’行2″列の単位行列であり、dtag
()は括弧内を対角要素とする対角行列である。
Gi=Ei■In-1・・・・・・・・・・・・・・・
・・・・・・・・・Between songs...songs・(2 pieces)
2 However, I is an identity matrix with 2' rows and 2'' columns, and dtag
() is a diagonal matrix with diagonal elements inside parentheses.

ここで逆2進順とは自然数を2進表現し、その桁を逆転
させた数を考え、その数の順序に並べることであり、、
H=3の場合X = (L X4 X2 X6XI X
5X3 X7 )となる。さらに各G、は、となる。
Here, reverse binary ordering means expressing natural numbers in binary, thinking of numbers with their digits reversed, and arranging them in the order of that number.
When H=3, X = (L X4 X2 X6XI X
5X3X7). Furthermore, each G becomes.

前記の行列Gi の各行ともゼロでない要素は2つのみ
であシ高速フーリエ変換で用いられるバタフライ演算と
同形の演算を表現している。ただし、その要素は±1の
みであるため加減算のみで実行できる。またウオルシュ
スペクトルはW = (W。
Each row of the matrix Gi has only two non-zero elements, representing an operation isomorphic to the butterfly operation used in fast Fourier transform. However, since the element is only ±1, it can be executed only by addition and subtraction. Also, the Walsh spectrum is W = (W.

W2W4W6W、 W5W、 W、 )として求められ
る。
W2W4W6W, W5W, W, ).

本発明の音声分析装置は、ケプス1ラム分析におけるフ
ーリエ変換および逆7−リエ変換へ置き換えることによ
シ、加減算器による簡単が演算器で構成できる利点を持
っている。さらにウオルシュ変換を用いた疑似バンドパ
スフィルタ分析装置に比較し、より細かで精密な声道特
性が得られる利点を持っている。
The speech analysis device of the present invention has the advantage that by replacing the Cepus 1 Ram analysis with the Fourier transform and the inverse 7-lier transform, the simple adder/subtractor can be constructed with an arithmetic unit. Furthermore, it has the advantage of obtaining more detailed and precise vocal tract characteristics than a pseudo bandpass filter analysis device that uses Walsh transform.

次に本発明の装置の具体的な構成を図面を参照しながら
説明する。
Next, the specific configuration of the apparatus of the present invention will be explained with reference to the drawings.

本発明の第1の実施例は第2図に示すように、第1バッ
ファメモリ部l第1ウメルシー演算部2、第1ウオルシ
ー変換制御部3、log変換部4、スケール変換部5、
第2バッファメモリ部6、第2ウオルシー演算部7、第
2ウオルシー変換制御部8よシ構成される。始めに入力
時系列データが第1バッファメモリ部1へ入力され一時
記憶される。
The first embodiment of the present invention, as shown in FIG.
It is composed of a second buffer memory section 6, a second Walshy calculation section 7, and a second Walshy conversion control section 8. First, input time series data is input to the first buffer memory section 1 and temporarily stored.

算の流れ図に従った第1ウオルシー変換制御部3の制御
信号により、第1段よシ第n段まで計算が進められる。
The calculation proceeds from the first stage to the nth stage by a control signal from the first Walshy transformation control unit 3 according to the calculation flowchart.

第i段の処理は、第4図に示した第i段の2n−1個の
バタフライ演算を実行することであり、+71式のGi
 の行列を乗することを意味している。
The processing of the i-th stage is to execute 2n-1 butterfly operations of the i-th stage shown in FIG.
This means multiplying the matrix of .

バタフライ演算は Ya−X8+Xb Yb=Xa−Xb  ・・・・・・・・・・・・・・・
・・・・・・・・・・・・・・・・・・・aCSまたは Ya−X8−Xb Yb−Xa+Xb ・・・・・・・・・・・・・・・・
・・・・・・・・・・・・・・・・・・aυであり、第
3図に示す第1ウオルシー演算部2にて求められる。バ
タフライ演算では始めにXa、Xbが第1バッファメモ
リ部1より読み出され、レジスタ2(11,202へそ
れぞれ格納される。加算器211と減算器212にで翰
まだはI式の加減算が求められ、その結果であるYa、
Ybは第1バッファメモリ部1のXa、Xbが記憶され
ていた場所へ書されていた場所へ亡かれ、減算器212
の出力はxbの場所へ1・かnる7、ま、tuυ式を選
択した場合は、加算器21】の出力はXbの場所′へ、
1かれ、減算器212の出力はX、1lCI)場所へ1
かれる。このuQまたは09式の選択i、i 第1ウオ
ルンユ変換fUi制御部3によって行われる。最終段で
ある第n段lで前記処理が終了すると、第1バツフアメ
七り1につAル/ユスベクトラ・、が得られる。
Butterfly operation is Ya-X8+Xb Yb=Xa-Xb ・・・・・・・・・・・・・・・
・・・・・・・・・・・・・・・・・・ aCS or Ya-X8-Xb Yb-Xa+Xb ・・・・・・・・・・・・・・・・・・
. . . aυ, which is obtained by the first Walshy calculation unit 2 shown in FIG. 3. In the butterfly operation, Xa and Xb are first read out from the first buffer memory section 1 and stored in registers 2 (11 and 202, respectively). and the result is Ya,
Yb is written to the location where Xa and Xb were stored in the first buffer memory section 1, and is written to the location where Xa and
The output of the adder 21 goes to the location of Xb, and if the tuυ formula is selected, the output of
1, the output of subtractor 212 is 1 to X, 1lCI)
It will be destroyed. The selection i, i of this uQ or the 09 formula is performed by the first wall conversion fUi control unit 3. When the above-mentioned processing is completed at the n-th stage, which is the final stage, the first batch of A/Usvectra is obtained.

ウメルソー変換が終了した後、第5図に示す一変換部4
とスクール変換部5によって、瞳パワーウオルシュスペ
クトルが求められ、スケール変換を行う写像関数Sm−
M(87)によシ変形交番数軸へ写像を行う。すなわち
、スケール変換制御部51は縞6図に示すタイムチャー
 NC従った制#信号を発し、始めに第1バツフアメ七
す部1よシ信号allc従ってウオルシュスペクトルの
偶el a W 2 tと奇数項Wzl+1  を順次
読み出し、籾変換部4の乗算器41で2乗され加算器4
2とアキュムレータ43を用いてパワーウォル7ユスベ
クトル(p 、 =W2j+W2i+曾)が求められ、
つづいて廟変換部4にて線変換され、信号a2をアドレ
スとして指示された写像関数値M(i)を写像関数チー
フルメモリ部52より読み出し、その出力M(ilを第
2バッファメモリ部6のアドレス信号a3として噸パワ
ーウオルシュスペクトル(疎P I)’cm2 ノくラ
フアメモリ部6のM(i)番地へ格納する0第2のウオ
ルシュ変換は第1ウオルシユ変換と同様に動作し7第2
バッファメモリ部6、第2ウオルシー変換部7、第2ク
オルシー変換制御部8にで実行さ註る。ところで、通常
音声認識ではグブヌトラムの低次の項のみ便用するため
、第2のウオルシュ変換は低次の項のみ計算すればよい
。そのため第2のウオルシュ変換は(5)式の変換行列
の低次の項のみ、すなわち(121式の交番数の小さい
kについて ただし、  N=2” のみ計算すればよい。
After the Umerso conversion is completed, the conversion unit 4 shown in FIG.
The pupil power Walsh spectrum is obtained by the school conversion unit 5, and the mapping function Sm- that performs scale conversion is calculated.
M(87) performs mapping onto the deformed alternating number axis. That is, the scale conversion control section 51 emits a control signal according to the time chart NC shown in FIG. Wzl+1 is sequentially read out, squared by the multiplier 41 of the paddy conversion unit 4, and then sent to the adder 4.
2 and the accumulator 43, the powerWal7Us vector (p, =W2j+W2i+S) is obtained,
Subsequently, the mapping function value M(i), which is line-converted in the mausoleum conversion unit 4 and designated using the signal a2 as an address, is read out from the mapping function chifur memory unit 52, and the output M(il) is sent to the second buffer memory unit 6. The second Walsh transform operates in the same way as the first Walsh transform, and the second Walsh transform operates in the same way as the first Walsh transform.
Note that this is executed by the buffer memory unit 6, the second Qualsi transformation unit 7, and the second Qualsi transformation control unit 8. By the way, in normal speech recognition, only the low-order terms of Guvnutrum are conveniently used, so the second Walsh transform only needs to calculate the low-order terms. Therefore, the second Walsh transformation only needs to be calculated for the low-order terms of the transformation matrix of Equation (5), that is, for k with a small number of alternations in Equation (121), only N=2'' needs to be calculated.

本発明の第2の実施例は、第2のウオルシュ変換を01
式にて求める装置であり、第1の実施例における第2ウ
オルシュ変換制御部8、第2ウオルン、淀算部7を第7
図に示す椛成へ変更したものである。第2ウメAシー変
換制御部7け第8図に示すタイツ、チ六・−トに従った
制御信号を発し、信@C/7によってアキュムレータ7
2をクリヤし、信号l)1に従って第2バッファメモリ
部6より変形線パワーウオルシュスペクトルx7g=i
ngp MIj f。
A second embodiment of the invention converts the second Walsh transform to 01
The second Walsh conversion control section 8, the second Waln, and the stagnation calculation section 7 in the first embodiment are replaced by the seventh
This is a modification to the one shown in the figure. The second Ume A sea conversion control unit 7 issues a control signal in accordance with the tights and chi six shown in FIG. 8, and the accumulator 7
2 is cleared, and the deformed line power Walsh spectrum x7g=i is obtained from the second buffer memory section 6 according to the signal l)1.
ngp MIj f.

読み出し、つ、tルンユ変換行列HkIIK従った+1
またC・ま−1の信号b2により加減算器711iアキ
ユムレータ72との間で加算または敷算を行う。すなわ
ち信号b2が+1の場合はACC+Xl−+ACCを行
い、信号b2が−1の場合はACC−Xl→A CCを
行う3.信号b1がN−1となった時アキュムレータ7
2ヘウオルシユ変換値Wkすなわち疑似ケグヌトラムが
得られる。
Readout +1 according to tRunyu transformation matrix HkIIK
Further, addition or subtraction is performed between the adder/subtracter 711i and the accumulator 72 using the signal b2 of C.mar-1. That is, when the signal b2 is +1, ACC+Xl-+ACC is performed, and when the signal b2 is -1, ACC-Xl→ACC is performed.3. When signal b1 becomes N-1, accumulator 7
A 2-Hewell transformation value Wk, that is, a pseudo-kegnutrum is obtained.

以上本発明を実1b例に基づき説明したが、これらのd
己戟は本発明の範囲を限定するものではない0特に本発
明の実施例ではFWT  のアルゴリズムとして(6)
式に丞すように人力時系を逆2進Jlに並べG1よりO
nまで順次積を取9求めていたが、t13式に示すよう
な正順序の時系列X′をGn% よ!1)Gt”まで順
次積を取シその結果とし2て逆2進順のウオルシュスペ
クトルWを得る方法も採用できることは明白である、 W”GI”G2  ” ’On”X ””””””u3
1また、パワースペクトルをPI−W2I十W2.+1
として求めているが、乗算器を必要としているためPi
ilW2 r l−1−IWz l+11のように絶対
値の和としてパワースペクトルを近似的に求める方法も
採用できることは明白である。
The present invention has been explained above based on Example 1b, but these d
Self-control does not limit the scope of the present invention.In particular, in the embodiment of the present invention, as an FWT algorithm (6)
As shown in the formula, the human time series is arranged in reverse binary Jl, and from G1 to O
The product was calculated sequentially up to n, but the time series X' in the normal order as shown in the t13 formula is Gn%! 1) It is obvious that it is also possible to adopt the method of taking the products sequentially up to Gt'' and obtaining the Walsh spectrum W in reverse binary order as the result 2. u3
1 Also, the power spectrum is PI-W2I×W2. +1
However, since a multiplier is required, Pi
It is obvious that a method of approximately obtaining the power spectrum as the sum of absolute values, such as ilW2 r l-1-IWz l+11, can also be adopted.

【図面の簡単な説明】[Brief explanation of the drawing]

第1図はスケール変換を示す図であり、第2図は本発明
の第1の実施例のブロック図であり、第3図は第1ウオ
ルシー演算部2のブロック図であシ、第4図は第1ウオ
ルシユ変換の計算の流れ図であり、第5図は一変換部4
とスケール変換部5のブロック図であり、第6図はスケ
ール変換のりイムチャートであシ、第7図は第2の実施
例における第2ウオルシー演算部7のブロック図であり
、第8図は第2ウオルシユ変換のタイムナヤートである
。 図において、lは第1バッファメモリ部、2は第1ウオ
ルシュ演算部、3は第1ウオルシュ変換制御部、4はへ
変換部、5はスケール変換部、6は第2バッファメモリ
部、7は第2ウオルシュ演算部、8は第2ウオルシユ変
換制御部201,202はレジスタ、211は加算器、
212は減n器である。 @5図において41は乗算器、42は加算器、43はア
キュムレータ、44は噸変換器、51はスクール変換制
御部、52は写像関数テーブルメモリ、71は加減算器
、72はアキュムレータである。 ギ 1 口 等 2 図 3       5       8 ギ 4  図 亭1段 瞭2吸    序n殴 ギ S 図 等   乙    図
FIG. 1 is a diagram showing scale conversion, FIG. 2 is a block diagram of the first embodiment of the present invention, FIG. 3 is a block diagram of the first Walshy calculation unit 2, and FIG. is a flowchart of the calculation of the first Walsh transformation, and FIG.
FIG. 6 is a scale conversion time chart, FIG. 7 is a block diagram of the second Walshy calculation section 7 in the second embodiment, and FIG. 8 is a block diagram of the scale conversion section 5. This is the timenayat of the second Walsh transformation. In the figure, l is the first buffer memory section, 2 is the first Walsh calculation section, 3 is the first Walsh conversion control section, 4 is the conversion section, 5 is the scale conversion section, 6 is the second buffer memory section, and 7 is the a second Walsh calculation unit; 8 is a second Walsh conversion control unit 201, 202 is a register; 211 is an adder;
212 is a reducer. @5 In Figure 5, 41 is a multiplier, 42 is an adder, 43 is an accumulator, 44 is a speech converter, 51 is a school conversion control section, 52 is a mapping function table memory, 71 is an adder/subtractor, and 72 is an accumulator. Gi 1 Kuchi etc. 2 Fig. 3 5 8 Gi 4 Fig.

Claims (1)

【特許請求の範囲】[Claims] 入力信号のウオルシュ変換を行う第1ウオルシー変換部
と、前記ウオルシュ変換部の出力よりウォルシーパワー
スベクトルを求めその線変換を行う線変換部と、ウォル
シー交番数軸のスケール変換を行う写像関数Sm=M(
se)によシ前記境変換部の出力を変形交番数軸へ写像
するスクール変換部と、前記スケール変換部の出力のウ
オルシュ変換を行う第2ウオルシュ変換部とを持つこと
を特徴とする音声分析装置。
a first Walshy transformer that performs Walsh transform of an input signal; a line transformer that obtains a Walshy Powers vector from the output of the Walsh transformer and performs line transformation thereof; and a mapping function Sm= that performs scale transformation of the Walshy alternating number axis. M(
se) a school transformer that maps the output of the boundary transformer onto a modified alternating number axis; and a second Walsh transformer that performs Walsh transform of the output of the scale transformer. Device.
JP58069475A 1983-04-20 1983-04-20 Voice analyzer Granted JPS59195287A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58069475A JPS59195287A (en) 1983-04-20 1983-04-20 Voice analyzer

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58069475A JPS59195287A (en) 1983-04-20 1983-04-20 Voice analyzer

Publications (2)

Publication Number Publication Date
JPS59195287A true JPS59195287A (en) 1984-11-06
JPH0219478B2 JPH0219478B2 (en) 1990-05-01

Family

ID=13403739

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58069475A Granted JPS59195287A (en) 1983-04-20 1983-04-20 Voice analyzer

Country Status (1)

Country Link
JP (1) JPS59195287A (en)

Also Published As

Publication number Publication date
JPH0219478B2 (en) 1990-05-01

Similar Documents

Publication Publication Date Title
JP3294604B2 (en) Processor for speech synthesis by adding and superimposing waveforms
US4544919A (en) Method and means of determining coefficients for linear predictive coding
JP3167787B2 (en) Digital speech coder
EP2555190A1 (en) Method, apparatus and computer program for suppressing noise
EP0128298B1 (en) Orthogonal transformer and apparatus operational thereby
JPH02272500A (en) Code driving voice encoding system
CN103875197B (en) A kind of for the input signal with multiple sound channels being carried out to directly-disperse the method and apparatus of decomposition
JP5129794B2 (en) Objective signal enhancement device, method and program
JPS59195287A (en) Voice analyzer
Patil et al. Implementation of Fast-ICA: A performance based comparison between floating point and fixed point DSP platform
JPS6145408B2 (en)
KR0147758B1 (en) Synthesis filter of mpeg-2 audio decoder
JPH027080B2 (en)
JP2007025296A (en) Speech feature quantity calculating device and program
US11984102B2 (en) Sound effect generation method and information processing device
US6721708B1 (en) Power saving apparatus and method for AC-3 codec by reducing operations
JP3252802B2 (en) Voice recognition device
Timmermann et al. Validation and performance analysis of a parameterizable normalized feedback fxlms architecture for fpga platforms
KR0151523B1 (en) Arithmatic processing speed-up circuit for digital audio decoder
JPH06175691A (en) Device and method for voice emphasis
US11838732B2 (en) Adaptive filterbanks using scale-dependent nonlinearity for psychoacoustic frequency range extension
Saambhavi et al. Design of feature extraction circuit for speech recognition applications
KR100424036B1 (en) Disassembly / synthesis filtering system with efficient nodal stack single-sided band filter bank using time-domain aliasing
Bai et al. Multirate synthesis of reverberators using subband filtering
JP3065067B2 (en) Equally spaced subband analysis filter and synthesis filter for MPEG audio multi-channel processing