JPS6229798B2 - - Google Patents
Info
- Publication number
- JPS6229798B2 JPS6229798B2 JP55102259A JP10225980A JPS6229798B2 JP S6229798 B2 JPS6229798 B2 JP S6229798B2 JP 55102259 A JP55102259 A JP 55102259A JP 10225980 A JP10225980 A JP 10225980A JP S6229798 B2 JPS6229798 B2 JP S6229798B2
- Authority
- JP
- Japan
- Prior art keywords
- signal
- processing circuit
- waveform
- formant
- input audio
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired
Links
- 230000005236 sound signal Effects 0.000 claims description 15
- 238000000034 method Methods 0.000 claims description 5
- 238000000926 separation method Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
Description
【発明の詳細な説明】
本発明は音韻認識に供する入力音声信号の特徴
パラメータを効果的に抽出することのできる音声
認識装置に関する。
パラメータを効果的に抽出することのできる音声
認識装置に関する。
近時、音声信号の特徴を数値的に抽出し、予め
登録された特徴パラメータと比較判定することに
よつて上記音声信号の音韻を認識することが行わ
れている。例えば従来、入力音声波形を周波数区
分して10〜20チヤンネルの周波数帯に分け、各チ
ヤンネルの出力を整流検波してその強度に対応し
た数値化処理を施している。また別の例では、入
力音声信号が零点をよぎる周波数や、各時間にお
けるエネルギーを数値化したり、更には入力音声
波形をフーリエ分解して幾つかのピーク周波数、
つまりフオルマントを求める等している。そして
これらの特徴パラメータに基づいて、その音韻を
推定していた。
登録された特徴パラメータと比較判定することに
よつて上記音声信号の音韻を認識することが行わ
れている。例えば従来、入力音声波形を周波数区
分して10〜20チヤンネルの周波数帯に分け、各チ
ヤンネルの出力を整流検波してその強度に対応し
た数値化処理を施している。また別の例では、入
力音声信号が零点をよぎる周波数や、各時間にお
けるエネルギーを数値化したり、更には入力音声
波形をフーリエ分解して幾つかのピーク周波数、
つまりフオルマントを求める等している。そして
これらの特徴パラメータに基づいて、その音韻を
推定していた。
ところが上記手法によれば信号処理が複雑であ
る上、実時間処理が非常に困難である等の問題が
あつた。しかも入力音声信号のスペクトラムの中
心周波数は変動するため、参照用パラメータとの
間にずれが生じて認識処理が困難になる等の問題
があつた。
る上、実時間処理が非常に困難である等の問題が
あつた。しかも入力音声信号のスペクトラムの中
心周波数は変動するため、参照用パラメータとの
間にずれが生じて認識処理が困難になる等の問題
があつた。
本発明はこのような事情を考慮してなされたも
ので、その目的とするところは、簡易にして入力
音声信号の有する特徴パラメータを抽出して効果
的な音韻認識処理を行い得る音声認識装置を提供
せんことにある。
ので、その目的とするところは、簡易にして入力
音声信号の有する特徴パラメータを抽出して効果
的な音韻認識処理を行い得る音声認識装置を提供
せんことにある。
即ち本発明は、入力音声信号の音韻は略第0
次、第1次、第2次フオルマントによつて代表さ
れ、第0次フオルマントが入力音声信号の積分波
形により、また第2次フオルマントが入力音声信
号の微分波形によりよく近似され、しかも第1次
フオルマントが原信号波形により近似されること
に着目してなされたものである。
次、第1次、第2次フオルマントによつて代表さ
れ、第0次フオルマントが入力音声信号の積分波
形により、また第2次フオルマントが入力音声信
号の微分波形によりよく近似され、しかも第1次
フオルマントが原信号波形により近似されること
に着目してなされたものである。
以下、図面を参照して本発明の実施例につき説
明する。
明する。
先ず音声波形は三角函数系にて展開近似するこ
とができ、その三角函数振幅は、微分および積分
波形において角周波数に比例および逆比例する。
例えばsin wtなる原波形を微分処理した場合w
cos wtなる波形を得、その振幅には角周波数が
反映される。この結果、音声波形の積分出力では
低周波成分が強調され、逆に微分波形では高周波
成分が強調されることになる。これ故、 第0次フオルマント:F0……積分波形 第1次フオルマント:F1……原波形 第2次フオルマント:F2……微分波形 なるフオルマントに反映された信号波形を得るこ
とが可能となる。
とができ、その三角函数振幅は、微分および積分
波形において角周波数に比例および逆比例する。
例えばsin wtなる原波形を微分処理した場合w
cos wtなる波形を得、その振幅には角周波数が
反映される。この結果、音声波形の積分出力では
低周波成分が強調され、逆に微分波形では高周波
成分が強調されることになる。これ故、 第0次フオルマント:F0……積分波形 第1次フオルマント:F1……原波形 第2次フオルマント:F2……微分波形 なるフオルマントに反映された信号波形を得るこ
とが可能となる。
しかして、今図に示すように、マイクロホン等
の入力装置1を介して入力された入力音声信号を
原波形処理回路2、微分波形処理回路3、積分波
形処理回路4にそれぞれ導く。これらの処理回路
3,4は入力音声信号をそれぞれ数値的に微分あ
るいは積分処理するものであり、例えば公知のア
ナログ的微分(積分)器や加減算器等を用いて構
成される。しかるのち、これらの処理回路2,
3,4をそれぞれ介して得られた信号は、数値化
回路5に導かれる。この数値化回路5から見た場
合、前記各処理回路2,3,4の出力は、従来の
周波数分離方式におけるバンドパスフイルタの出
力、つまり個々のチヤンネルに相当したものとな
つている。しかして数値化回路5では、予め定め
られた手法に従つて、例えば上記3つのチヤンネ
ルの入力信号の各々に対し各クロツク毎に信号値
の絶対値を算出し、その総和をそれぞれ求めてい
る。これは従来の全波整流に相当した処理であ
る。尚、各種信号成分のモーメントや分布を求め
る等の信号処理を施して、入力音声信号の特徴パ
ラメータを抽出するようにしてもよいことは勿論
のことである。このようにして絶対値の総和処理
により求められた入力音声信号の特徴パラメータ
を入力する比較装置6は、参照メモリ7に予め登
録された各種音韻の特徴パラメータと逐次参照比
較して、上記入力音声信号の音韻の認識処理を行
つている。この認識処理により判定された前記入
力音声信号に対する結果が、つまり認識音韻デー
タが出力装置8を介して出力される。
の入力装置1を介して入力された入力音声信号を
原波形処理回路2、微分波形処理回路3、積分波
形処理回路4にそれぞれ導く。これらの処理回路
3,4は入力音声信号をそれぞれ数値的に微分あ
るいは積分処理するものであり、例えば公知のア
ナログ的微分(積分)器や加減算器等を用いて構
成される。しかるのち、これらの処理回路2,
3,4をそれぞれ介して得られた信号は、数値化
回路5に導かれる。この数値化回路5から見た場
合、前記各処理回路2,3,4の出力は、従来の
周波数分離方式におけるバンドパスフイルタの出
力、つまり個々のチヤンネルに相当したものとな
つている。しかして数値化回路5では、予め定め
られた手法に従つて、例えば上記3つのチヤンネ
ルの入力信号の各々に対し各クロツク毎に信号値
の絶対値を算出し、その総和をそれぞれ求めてい
る。これは従来の全波整流に相当した処理であ
る。尚、各種信号成分のモーメントや分布を求め
る等の信号処理を施して、入力音声信号の特徴パ
ラメータを抽出するようにしてもよいことは勿論
のことである。このようにして絶対値の総和処理
により求められた入力音声信号の特徴パラメータ
を入力する比較装置6は、参照メモリ7に予め登
録された各種音韻の特徴パラメータと逐次参照比
較して、上記入力音声信号の音韻の認識処理を行
つている。この認識処理により判定された前記入
力音声信号に対する結果が、つまり認識音韻デー
タが出力装置8を介して出力される。
このように本装置によれば、微分および積分と
云う簡単な信号処理によつて第0次、第1次およ
び第2次フオルマントにほぼ対応した特徴パラメ
ータを得ることができ、従来の周波数分離に比し
てはるかに簡易に、且つ実時間処理することがで
きる。しかもこれらの特徴パラメータは、周波数
分離法のように不特定なチヤンネルに分配される
ことがないので、認識処理が非常に容易である。
つまり従来の如き周波数分離によれば入力音声信
号のスペクトラムによつて特徴パラメータである
フオルマツトの存在するチヤンネルに変動が生じ
ることがあり、そのチヤンネル検出を要する等の
問題があるが、フオルマントが確実に求められる
ので、その不具合がない。従つて音韻を直接的に
見出すことができるので、信号処理の大幅な簡素
化を図り得る。しかもリアルタイム処理が可能な
ので、その有用性は非常に高い。
云う簡単な信号処理によつて第0次、第1次およ
び第2次フオルマントにほぼ対応した特徴パラメ
ータを得ることができ、従来の周波数分離に比し
てはるかに簡易に、且つ実時間処理することがで
きる。しかもこれらの特徴パラメータは、周波数
分離法のように不特定なチヤンネルに分配される
ことがないので、認識処理が非常に容易である。
つまり従来の如き周波数分離によれば入力音声信
号のスペクトラムによつて特徴パラメータである
フオルマツトの存在するチヤンネルに変動が生じ
ることがあり、そのチヤンネル検出を要する等の
問題があるが、フオルマントが確実に求められる
ので、その不具合がない。従つて音韻を直接的に
見出すことができるので、信号処理の大幅な簡素
化を図り得る。しかもリアルタイム処理が可能な
ので、その有用性は非常に高い。
尚、本発明は上記実施例に限定されるものでは
ない。実施例では微分波形および積分波形を用い
たが、いずれか一方のみを用いても或る程度の効
果が期待できる。また2次微分波形や2次積分波
形等も利用することによつてフオルマントの特徴
パラメータの強調を図り、これによつて特徴を効
果的に抽出するようにしてもよい。更には微分・
積分出力を従来のように周波数分離したのち特徴
抽出して音韻認識するようにしてもよい。要する
に本発明はその要旨を逸脱しない範囲で種々変形
して実施することができる。
ない。実施例では微分波形および積分波形を用い
たが、いずれか一方のみを用いても或る程度の効
果が期待できる。また2次微分波形や2次積分波
形等も利用することによつてフオルマントの特徴
パラメータの強調を図り、これによつて特徴を効
果的に抽出するようにしてもよい。更には微分・
積分出力を従来のように周波数分離したのち特徴
抽出して音韻認識するようにしてもよい。要する
に本発明はその要旨を逸脱しない範囲で種々変形
して実施することができる。
以上、詳述したように本発明は原信号波形と共
に、その微分あるいは積分波形を用いてフオルマ
ントに対応した特徴パラメータを抽出して音韻認
識するもので、従来に比して非常に簡易に且つ効
果的な音韻認識を可能とする。しかも実時間処理
が可能で装置構成を大幅な簡略化を図り得る等の
絶大なる効果を奏する実用性の高い音声認識装置
をここに提供することができる。
に、その微分あるいは積分波形を用いてフオルマ
ントに対応した特徴パラメータを抽出して音韻認
識するもので、従来に比して非常に簡易に且つ効
果的な音韻認識を可能とする。しかも実時間処理
が可能で装置構成を大幅な簡略化を図り得る等の
絶大なる効果を奏する実用性の高い音声認識装置
をここに提供することができる。
図は本発明の一実施例装置を示す概略構成図で
ある。 1……入力装置、2……原波形処理回路、3…
…微分波形処理回路、4……積分波形処理回路、
5……数値化回路、6……比較装置、7……参照
メモリ、8……出力装置。
ある。 1……入力装置、2……原波形処理回路、3…
…微分波形処理回路、4……積分波形処理回路、
5……数値化回路、6……比較装置、7……参照
メモリ、8……出力装置。
Claims (1)
- 1 入力音声信号を処理して第1次フオルマント
に近似した信号を得る原波形処理回路と、入力音
声信号を微分して第2次フオルマントに近似した
信号を得る微分波形処理回路と、入力音声信号を
積分して第0次フオルマントに近似した信号を得
る積分波形処理回路と、上記原波形処理回路及び
微分波形処理回路並びに積分波形処理回路で処理
された信号値の絶対値を算出してそれぞれの総和
処理を行なう数値化回路と、上記総和処理により
得られた入力音声信号の特徴パラメーと所定の特
徴パラメータとを比較して音韻の認識処理を行な
う比較装置とを具備したことを特徴とする音声認
識装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP10225980A JPS5727298A (en) | 1980-07-25 | 1980-07-25 | Voice recognizing device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP10225980A JPS5727298A (en) | 1980-07-25 | 1980-07-25 | Voice recognizing device |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS5727298A JPS5727298A (en) | 1982-02-13 |
JPS6229798B2 true JPS6229798B2 (ja) | 1987-06-29 |
Family
ID=14322587
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP10225980A Granted JPS5727298A (en) | 1980-07-25 | 1980-07-25 | Voice recognizing device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS5727298A (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS58190999A (ja) * | 1982-04-30 | 1983-11-08 | 松下電器産業株式会社 | 音声認識装置 |
JP4001897B2 (ja) * | 2005-12-09 | 2007-10-31 | 株式会社コナミデジタルエンタテインメント | 音楽ジャンル判別装置及びこれを備えたゲーム機 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS50114904A (ja) * | 1974-02-16 | 1975-09-09 |
-
1980
- 1980-07-25 JP JP10225980A patent/JPS5727298A/ja active Granted
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS50114904A (ja) * | 1974-02-16 | 1975-09-09 |
Also Published As
Publication number | Publication date |
---|---|
JPS5727298A (en) | 1982-02-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5884260A (en) | Method and system for detecting and generating transient conditions in auditory signals | |
US5483617A (en) | Elimination of feature distortions caused by analysis of waveforms | |
CA1164569A (en) | System for extraction of pole/zero parameter values | |
JPS6366600A (ja) | 話者の音声を前処理して次の処理のための正規化された信号を得る方法および装置 | |
JPH069000B2 (ja) | 音声情報処理方法 | |
JPS6229798B2 (ja) | ||
JPH0237600B2 (ja) | ||
JPS63153598A (ja) | 音声スペクトル分析方法 | |
JPH0461359B2 (ja) | ||
JP2557497B2 (ja) | 男女声の識別方法 | |
bachir Tazi | Fusion Approach for Robust Speaker Identification system | |
JP2569472B2 (ja) | 音声分析装置 | |
JPS63265300A (ja) | 音声の特徴抽出方法 | |
JPS61273599A (ja) | 音声認識装置 | |
JPS6227798A (ja) | 音声認識装置 | |
JPH0146078B2 (ja) | ||
JPH0731506B2 (ja) | 音声認識方法 | |
JPH07104675B2 (ja) | 音声認識方法 | |
JP2000250599A (ja) | 音響特徴抽出方法及び装置 | |
JPS63223696A (ja) | 音声パタ−ン作成方式 | |
JPH01134398A (ja) | 音声分析装置 | |
JPH0558560B2 (ja) | ||
JPH01269998A (ja) | 音声認識装置の辞書作成方式 | |
JPS60159900A (ja) | 音声認識装置 | |
JPS5852600B2 (ja) | 音声の基本周期抽出装置 |