JPS58220196A - 音声認識装置 - Google Patents
音声認識装置Info
- Publication number
- JPS58220196A JPS58220196A JP10350482A JP10350482A JPS58220196A JP S58220196 A JPS58220196 A JP S58220196A JP 10350482 A JP10350482 A JP 10350482A JP 10350482 A JP10350482 A JP 10350482A JP S58220196 A JPS58220196 A JP S58220196A
- Authority
- JP
- Japan
- Prior art keywords
- ultrasonic
- output
- recognition
- voice recognition
- frequency
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
この発明は音声特に子音部の認識を有効に行なう認識装
置にかかる。
置にかかる。
音声の認識は従来は可聴周波数30 Hz〜8KHZ帯
に限定して行なわれた。特に母韻のホルマントはI K
11 Z内外で分析が行なわれ、子音部に関しては適
確な方法はなかった。
に限定して行なわれた。特に母韻のホルマントはI K
11 Z内外で分析が行なわれ、子音部に関しては適
確な方法はなかった。
この発明は発声に伴い特に子音部では多く超音波帯の空
気振動が存在リーることの発見にもとづく。これは従来
の6■聴周波マイクのみによる認識と−・線を割するも
ので、発声には超町聴周波、超音波の成分が音韻に密接
に関連して存在していたのに気附いたものである。すな
わち人間が聴覚できないでも機械が聴覚できる空間が残
されていた。
気振動が存在リーることの発見にもとづく。これは従来
の6■聴周波マイクのみによる認識と−・線を割するも
ので、発声には超町聴周波、超音波の成分が音韻に密接
に関連して存在していたのに気附いたものである。すな
わち人間が聴覚できないでも機械が聴覚できる空間が残
されていた。
そこでこの発明においては、音声を一面においては超音
波帯まで感度のあるマイクを用い、更にフィルタによっ
て従来の可聴周波数帯を大部分抑圧しでほぼ超音波領域
においで認識を行なう。このようにして得られた超音波
成分は音韻の種類に応じて異なった空間分布を持ち、こ
れが認識に応用されることは同日出願の特許願(2)添
付の明細書に記載の如くであ名。本発明においては、主
としてこの超音波の周波数スペクトルが音韻によって異
なることを利用する。もちろん、前記出願の空間分布を
併用してもよい。
波帯まで感度のあるマイクを用い、更にフィルタによっ
て従来の可聴周波数帯を大部分抑圧しでほぼ超音波領域
においで認識を行なう。このようにして得られた超音波
成分は音韻の種類に応じて異なった空間分布を持ち、こ
れが認識に応用されることは同日出願の特許願(2)添
付の明細書に記載の如くであ名。本発明においては、主
としてこの超音波の周波数スペクトルが音韻によって異
なることを利用する。もちろん、前記出願の空間分布を
併用してもよい。
第1図は本発明の説明図を示す。lは口唇で、マイク2
が検音しその出力はバイパスフィルタ3を経てほぼ超音
波成分を得る、周波数分析器あるいは周波数カウンタ4
へ送られ、出力端子5に出力を生しる。場合によっては
バイパスフィルタ3をバンドパスフィルタとし、主に子
音の生じる超音波帯を選出させてもよい。
が検音しその出力はバイパスフィルタ3を経てほぼ超音
波成分を得る、周波数分析器あるいは周波数カウンタ4
へ送られ、出力端子5に出力を生しる。場合によっては
バイパスフィルタ3をバンドパスフィルタとし、主に子
音の生じる超音波帯を選出させてもよい。
第2図は第1図の変形で、マイク2の出力は超音波バン
トパスフィルタ7.8.9・・・へ導かれ、各音韻に応
じたフィルタ出力を処理器10で処理し分析出力を与え
る。実測の結果を例示すれば、特に超音波の多いのは子
音であって、基本波・は「S」は22 K Hz 、
r c h Jは27 K Hz、「Sh」は25
K Hzとなり、個人差もある。そこで話者識別にも応
用できる。処理器10は周波数カウンタを用いてもよい
。このカウンタ出力を予め測定された音韻による超音波
周波数のパタンをROM12に蓄えたものから出力端子
5に認識出力を得る。
トパスフィルタ7.8.9・・・へ導かれ、各音韻に応
じたフィルタ出力を処理器10で処理し分析出力を与え
る。実測の結果を例示すれば、特に超音波の多いのは子
音であって、基本波・は「S」は22 K Hz 、
r c h Jは27 K Hz、「Sh」は25
K Hzとなり、個人差もある。そこで話者識別にも応
用できる。処理器10は周波数カウンタを用いてもよい
。このカウンタ出力を予め測定された音韻による超音波
周波数のパタンをROM12に蓄えたものから出力端子
5に認識出力を得る。
本発明の超音波による認識は上記の如く同日出願の明細
書記載の如き超音波の空間パタンの特性と糾合ぜてもよ
い。更に発明者出願特願昭56−号記載の如き音声の直
流分による 認識とljt用しでもよい。超音波出力と直流分とは−
・定の関係が各音韻個有であって、これも認識に使い得
る。
書記載の如き超音波の空間パタンの特性と糾合ぜてもよ
い。更に発明者出願特願昭56−号記載の如き音声の直
流分による 認識とljt用しでもよい。超音波出力と直流分とは−
・定の関係が各音韻個有であって、これも認識に使い得
る。
このように、人間の音声は非可聴であっても機械ならば
認識できるファクタが種々あることが判る。
認識できるファクタが種々あることが判る。
第3図は上記の如く超音波センサ2と処理器15による
分析出力と、直流分検出器20と処理部17の出力とを
回路20で再処理して認識出力25を得る回路を示す。
分析出力と、直流分検出器20と処理部17の出力とを
回路20で再処理して認識出力25を得る回路を示す。
本発明は上記特定例に限らず種々の変形ができる。
第1図は本発明による音声認識装置を示す。第2図は第
1図の変形である、第3図は本発明による音声認識装置
を示す。
1図の変形である、第3図は本発明による音声認識装置
を示す。
Claims (1)
- 音声の周波数成分の内可聴周波数帯よりも高い周波数帯
の周波数スペクトルに応答する手段を備えた音声認識装
置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP10350482A JPS58220196A (ja) | 1982-06-16 | 1982-06-16 | 音声認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP10350482A JPS58220196A (ja) | 1982-06-16 | 1982-06-16 | 音声認識装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS58220196A true JPS58220196A (ja) | 1983-12-21 |
Family
ID=14355805
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP10350482A Pending JPS58220196A (ja) | 1982-06-16 | 1982-06-16 | 音声認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS58220196A (ja) |
-
1982
- 1982-06-16 JP JP10350482A patent/JPS58220196A/ja active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Glenn et al. | Speaker identification based on nasal phonation | |
US20080162119A1 (en) | Discourse Non-Speech Sound Identification and Elimination | |
CN110663080A (zh) | 通过频谱包络共振峰的频移动态修改语音音色的方法和装置 | |
Singh et al. | MFCC VQ based speaker recognition and its accuracy affecting factors | |
Kersta | Voiceprint‐Identification Infallibility | |
JPS5835600A (ja) | 音声情報処理方法 | |
JPS58220196A (ja) | 音声認識装置 | |
JP2841797B2 (ja) | 音声分析・合成装置 | |
Dai et al. | An improved model of masking effects for robust speech recognition system | |
RU2107950C1 (ru) | Способ идентификации личности по фонограммам произвольной устной речи | |
JPH0475520B2 (ja) | ||
JP2968976B2 (ja) | 音声認識装置 | |
Ramig et al. | Acoustic correlates of aging | |
Indrebo et al. | A combined sub-band and reconstructed phase space approach to phoneme classification | |
JPH0318720B2 (ja) | ||
Kajita et al. | A binaural speech processing method using subband-cross correlation analysis for noise robust recognition | |
JPS6367400B2 (ja) | ||
JPS5913676Y2 (ja) | ボコ−ダ− | |
Czyzewski et al. | A method for spectral transposition of speech signal applicable in profound hearing loss | |
JPH0567039B2 (ja) | ||
Truby | Contribution of the Pharyngeal Cavity to Vowel Resonance and in General | |
Nawfal et al. | King-Kopetzky syndrome: An approach for a solution | |
JP2008165113A (ja) | 音声合成装置 | |
Beckman et al. | Invariance of transitional movements under changes in lexical stress | |
Burzynski et al. | Effects of auditory maskers on whistling and voicing |