JP2507311B2 - Voice analyzer - Google Patents
Voice analyzerInfo
- Publication number
- JP2507311B2 JP2507311B2 JP61017157A JP1715786A JP2507311B2 JP 2507311 B2 JP2507311 B2 JP 2507311B2 JP 61017157 A JP61017157 A JP 61017157A JP 1715786 A JP1715786 A JP 1715786A JP 2507311 B2 JP2507311 B2 JP 2507311B2
- Authority
- JP
- Japan
- Prior art keywords
- buffer
- analysis
- voice
- contact
- adder
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Description
【発明の詳細な説明】 1)発明の分野 本発明は、デジタル処理による音声認識及び音声分析
に関するものである。Description: 1) Field of the Invention The present invention relates to voice recognition and voice analysis by digital processing.
2)従来技術 一般に、音声認識及び音声分析をデジタル処理で行な
う場合、膨大な情報量を持つ音声信号を、フーリエ変換
やウォルシュ変換などで直交変換し、情報量を圧縮し、
特徴量を抽出することが行なわれている。2) Prior Art Generally, when performing voice recognition and voice analysis by digital processing, a voice signal having a huge amount of information is orthogonally transformed by Fourier transform, Walsh transform, or the like to compress the amount of information,
Extraction of feature quantities is performed.
フーリエ変換やウォルシュ変換を用いる場合、周波数
分解能及び特徴量の時間変動との兼合いから時間窓を設
け、時系列データである音声の1部分を取り出して処理
を行なうのが一般的である。In the case of using the Fourier transform or Walsh transform, it is general that a time window is provided in consideration of the frequency resolution and the time variation of the feature amount, and a part of the voice that is time series data is extracted and processed.
この時間窓は音声信号のサンプリング間隔と処理の容
易さとの兼合いから32msec程度のものになることが多い
(参考文献,例えば共立出版刊「音声認識」新美康永
著,オーム社刊「音声情報処理の基礎」斉藤収三ら,な
どに詳しい)。This time window is often about 32 msec due to the balance between the sampling interval of the voice signal and the ease of processing (references, for example, Kyoritsu Shuppan "Speech Recognition" by Yasunaga Niimi, Ohmsha "Speech Information" Basics of processing "Sato Saito et al., Etc.).
前記時間窓長は、例えばサンプリング間隔が0.125mse
cの場合、データ数換算で256データにより、このデータ
を保持しておく記憶領域が256個必要である。The time window length is, for example, a sampling interval of 0.125 mse.
In the case of c, since there are 256 data in terms of the number of data, 256 storage areas for holding this data are required.
更に、音声信号の特徴量の時間変動追従性を高めるた
めに、時間窓を一部重複させて計算することも広く行な
われている。例えば、32msecのうち16msec分を重複させ
ることが一般的である。この処理されたデータの出現時
間間隔をフレームレートと呼ぶ。Further, in order to improve the time variation followability of the feature amount of the audio signal, it is widely practiced to partially overlap the time windows for calculation. For example, it is common to overlap 16 msec of 32 msec. The appearance time interval of the processed data is called a frame rate.
上記の条件を満足する処理装置を実現しようとする場
合、少なくとも384個以上の記憶領域と、全処理を16mse
c以内に終了できる高速性が要求されるので、安価で記
憶領域も少なく、しかも比較的低速な汎用の1チップマ
イクロプロセッサなどを利用した装置で、実現するのは
従来不可能であった。In order to realize a processing device that satisfies the above conditions, at least 384 or more storage areas and 16 mse
Since it is required to have a high speed so that it can be completed within c, it has hitherto been impossible to realize with a device using a general-purpose one-chip microprocessor which is inexpensive, has a small storage area, and is relatively slow.
3)発明の目的 本発明は前記欠点である記憶領域及び計算量を減少
し、安価に実現できる音声分析装置を提供することであ
る。3) Object of the Invention The present invention is to provide a speech analysis apparatus which can be realized at a low cost by reducing the storage area and the calculation amount which are the above-mentioned drawbacks.
4)発明の構成 実時間処理を行なう音声分析装置において、従来の時
間窓より短かい、即ち、記憶領域及び処理量の少ない音
声分析部と、分析結果を保持するバッファ部と、1個ま
たは複数の加算器と、前記加算器と対を成す加算結果を
保持するバッファ部と、前記加算器及びバッファ部とを
制御する制御部と、前記バッファ部の内容を加算する加
算器と、加算した結果を保持するバッファ部を有するこ
とを構成上の特徴とする。4) Configuration of the invention In a voice analysis device that performs real-time processing, a voice analysis unit that is shorter than a conventional time window, that is, has a smaller storage area and less processing amount, a buffer unit that holds an analysis result, and one or a plurality of units. Adder, a buffer unit that holds the addition result that forms a pair with the adder, a control unit that controls the adder and the buffer unit, an adder that adds the contents of the buffer unit, and the addition result Is characterized in that it has a buffer unit for holding
5)発明の効果 本発明を用いれば従来、大きな記憶容量と、多くの処
理量とが必要であった音声分析装置を、小さな記憶容量
と少ない処理量で、同等の情報量の得られる音声分析装
置が実現できる。5) Effect of the Invention According to the present invention, a voice analysis device that has conventionally required a large storage capacity and a large amount of processing can be used to obtain an equivalent amount of information with a small storage capacity and a small amount of processing. The device can be realized.
例えば前述の例(分析時間窓32msec,フレームレート1
6msec,サンプリング間隔0.125msec)では、記憶容量は3
84個,処理量は、FFTを用いるとすると、1024回のバタ
フライ演算が必要である。For example, the above example (analysis time window 32msec, frame rate 1
6msec, sampling interval 0.125msec), the memory capacity is 3
Assuming 84 pieces, the amount of processing is 1024 butterfly calculations if FFT is used.
これを、音声分析部を時間窓8msecのFFTで行なうとす
ると、記憶容量は64個,処理量は192回のバタフライ演
算となり、記憶容量で1/6,処理量で約1/5となる効果が
ある。If this is performed by an FFT with a time window of 8 msec in the speech analysis unit, the storage capacity will be 64, and the processing amount will be 192 times of butterfly calculations, and the storage capacity will be 1/6 and the processing amount will be approximately 1/5. There is.
6)実施例 以下に本発明の音声分析装置の実施例について、図面
を用いて説明する。6) Example An example of the speech analysis apparatus of the present invention will be described below with reference to the drawings.
第1図は、音声分析部の時間窓を8msecとした場合
に、分析時間窓32msec,フレームレート16msec相当の音
声分析装置の主要ブロック図である。FIG. 1 is a main block diagram of a voice analysis device corresponding to an analysis time window of 32 msec and a frame rate of 16 msec when the time window of the voice analysis unit is 8 msec.
なお、音声分析部は公知の分析方式のもので良い。 The voice analysis unit may be of a known analysis method.
第1図において、音声分析部1は、8msec分の音声デ
ータを公知の方式により分析し、分析結果を分析バッフ
ァー2に書き込む。また音声分析部1は、コントローラ
6に1回の分析が終了する毎に、信号を送る。In FIG. 1, the voice analysis unit 1 analyzes voice data of 8 msec by a known method and writes the analysis result in the analysis buffer 2. The voice analysis unit 1 also sends a signal to the controller 6 each time one analysis is completed.
コントローラ6は、音声分析部1の信号により、切り
換えスイッチ3を接点12→接点13→接点14→接点15→接
点12の順に切り換える。接点12が接続すると、分析バッ
ファ2の内容をバッファ7に送る。接点13が接続すると
分析バッファ2の内容とバッファ7の内容を加算器4で
加算し、バッファ7に送る。The controller 6 switches the changeover switch 3 in the order of contact 12 → contact 13 → contact 14 → contact 15 → contact 12 according to a signal from the voice analysis unit 1. When the contact 12 is connected, the contents of the analysis buffer 2 are sent to the buffer 7. When the contact 13 is connected, the contents of the analysis buffer 2 and the contents of the buffer 7 are added by the adder 4 and sent to the buffer 7.
接点14を接続すると、分析バッファ2の内容をバッフ
ァ8に送る。接点15を接続すると分析バッファ2の内容
とバッファ8の内容を加算器5で加算し、バッファ8に
送る。Connecting contact 14 sends the contents of analysis buffer 2 to buffer 8. When the contact 15 is connected, the contents of the analysis buffer 2 and the contents of the buffer 8 are added by the adder 5 and sent to the buffer 8.
接点13と接点15が接続すると、バッファ7及びバッフ
ァ8には16msec分のデータが存在することになる。When the contact 13 and the contact 15 are connected, 16 msec worth of data exists in the buffer 7 and the buffer 8.
コントローラ6は接点13と接点15が接続される場合だ
け、加算器9に信号を送り、バッファ7とバッファ8の
内容を加算し、除算器10に結果を送る。Only when the contacts 13 and 15 are connected, the controller 6 sends a signal to the adder 9, adds the contents of the buffers 7 and 8, and sends the result to the divider 10.
除算器はこの場合、4回分の分析結果の平均化処理を
行なうので、4で割る処理を行なう。In this case, the divider performs the averaging process of the analysis results for four times, and thus performs the process of dividing by 4.
4で割る処理はシフターによる2bitシフトでも実現で
きるので除算器10はシフターに置き換えられる。The division by 10 can be replaced with a shifter because the process of dividing by 4 can be realized by a 2-bit shift by a shifter.
除算結果は、平均化バッファ11に送られ、平均化バッ
ファ11は分析結果としてバッファの内容を出力する。The division result is sent to the averaging buffer 11, and the averaging buffer 11 outputs the contents of the buffer as the analysis result.
これら一連の処理の時間推移を第2図に示す。 The time transition of the series of processes is shown in FIG.
第2図において、タイミング1は、第1図における音
声分析部1から分析結果が出力されるタイミングであ
る。In FIG. 2, timing 1 is the timing at which the analysis result is output from the voice analysis unit 1 in FIG.
Tは、前記の例では8msecである。 T is 8 msec in the above example.
タイミング2は、第1図における接点12及び接点14が
接続されるタイミングであり、タイミング3は第1図に
おける接点13及び接点15が接続され、加算器9が動作
し、分析結果が出力するタイミングである。Timing 2 is the timing at which the contact 12 and contact 14 in FIG. 1 are connected, and timing 3 is the timing at which the contact 13 and contact 15 in FIG. 1 are connected and the adder 9 operates and the analysis result is output. Is.
以上の実施例では、音声分析部の時間窓Tに対して、
時間窓4T,フレームレート2Tの分析装置を示したが、第
1図における切り換えスイッチ3の接点数及びバッファ
ーと加算器の対を任意の数にすることで、例えば時間窓
6T,フレームレート3Tのような構成とすることができる
ことは自明である。In the above embodiment, with respect to the time window T of the voice analysis unit,
Although an analyzer having a time window of 4T and a frame rate of 2T is shown, the number of contact points of the changeover switch 3 and the number of pairs of buffer and adder in FIG.
It is obvious that a configuration such as 6T and frame rate 3T can be used.
以上説明したように、本発明の音声分析装置によれ
ば、少ない記憶容量と少ない処理量でも従来の大記憶容
量と大処理量の音声分析装置と同一の情報量を有する音
声分析装置を実現することが可能である。As described above, according to the voice analysis device of the present invention, a voice analysis device having the same amount of information as a conventional large storage capacity and large processing amount voice analysis device is realized even with a small storage capacity and a small processing amount. It is possible.
第1図は、本発明の一実施例を示す分析装置の主要ブロ
ック図、第2図は、第1図のタイミング図である。 1……音声分析部,2……分析バッファ,3……切り換えス
イッチ,4……加算器,5……加算器,6……コントローラ,7
……バッファ,8……バッファ,9……加算器,10……除算
器またはシフター,11……平均化バッファ。FIG. 1 is a main block diagram of an analyzer according to an embodiment of the present invention, and FIG. 2 is a timing diagram of FIG. 1 ... Voice analysis unit, 2 ... Analysis buffer, 3 ... Changeover switch, 4 ... Adder, 5 ... Adder, 6 ... Controller, 7
... buffer, 8 ... buffer, 9 ... adder, 10 ... divider or shifter, 11 ... averaging buffer.
Claims (1)
量のバッファに記憶し出力する音声分析装置において、
前記所定量のバッファより小さい容量のバッファを用
い、該小さい容量のバッファに入力された分析信号と新
たに入力された分析信号とを加算し、しかる後平均化処
理を行う事を特徴とする音声分析装置。1. A voice analysis device for storing and outputting an analysis signal analyzed by a voice analysis unit in a predetermined amount of buffer,
A voice characterized by using a buffer having a capacity smaller than the predetermined amount of buffer, adding an analysis signal input to the buffer having a small capacity and a newly input analysis signal, and then performing averaging processing. Analysis equipment.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP61017157A JP2507311B2 (en) | 1986-01-28 | 1986-01-28 | Voice analyzer |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP61017157A JP2507311B2 (en) | 1986-01-28 | 1986-01-28 | Voice analyzer |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS62174799A JPS62174799A (en) | 1987-07-31 |
JP2507311B2 true JP2507311B2 (en) | 1996-06-12 |
Family
ID=11936138
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP61017157A Expired - Lifetime JP2507311B2 (en) | 1986-01-28 | 1986-01-28 | Voice analyzer |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2507311B2 (en) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8411880B2 (en) * | 2008-01-29 | 2013-04-02 | Qualcomm Incorporated | Sound quality by intelligently selecting between signals from a plurality of microphones |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS58216296A (en) * | 1982-06-10 | 1983-12-15 | 株式会社東芝 | Voice analyzer |
JPS5965893A (en) * | 1982-10-08 | 1984-04-14 | 日本電気株式会社 | Voice synthesizer |
-
1986
- 1986-01-28 JP JP61017157A patent/JP2507311B2/en not_active Expired - Lifetime
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS58216296A (en) * | 1982-06-10 | 1983-12-15 | 株式会社東芝 | Voice analyzer |
JPS5965893A (en) * | 1982-10-08 | 1984-04-14 | 日本電気株式会社 | Voice synthesizer |
Also Published As
Publication number | Publication date |
---|---|
JPS62174799A (en) | 1987-07-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US4544919A (en) | Method and means of determining coefficients for linear predictive coding | |
JPH06503186A (en) | Speech synthesis method | |
JP2507311B2 (en) | Voice analyzer | |
US4689759A (en) | Process and installation for the analysis and retrieval of a sampling and interpolation signal | |
KR890016554A (en) | Impulse Noise Detection and Suppression System | |
EP0584766A1 (en) | Speech codec and a method of processing a speech signal with speech codec | |
JPH02310600A (en) | Multipulse voice coding method | |
JP2780458B2 (en) | Vector quantization method and speech coding / decoding device | |
EP0604772A1 (en) | Method and device for discrete-time signal interpolation | |
JP2695903B2 (en) | A method for calculating the amount of distortion of the voice packet loss compensation waveform. | |
JPS59226520A (en) | Noise eliminating device | |
SU980133A1 (en) | Device for analysis and synthesis of speech signal | |
JP2695904B2 (en) | A method for calculating the amount of distortion of the voice packet loss compensation waveform. | |
JPH0378637B2 (en) | ||
SU1062684A1 (en) | Device for information processing | |
JPH0532760B2 (en) | ||
JPS62180398A (en) | Pole parameter value extractor | |
JPS59632A (en) | Signal analyzer | |
JPS6237800B2 (en) | ||
JPH02234199A (en) | Phase correcting device | |
Hodgkiss et al. | Power normalization sensitivity of adaptive lattice structures | |
JP2000206984A (en) | Voice recognition device | |
JPS627098A (en) | Multipulse encoder | |
JPS6368900A (en) | Voice analyzer | |
JPS63197999A (en) | Voice coding system |