JPS6022193A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPS6022193A
JPS6022193A JP58130677A JP13067783A JPS6022193A JP S6022193 A JPS6022193 A JP S6022193A JP 58130677 A JP58130677 A JP 58130677A JP 13067783 A JP13067783 A JP 13067783A JP S6022193 A JPS6022193 A JP S6022193A
Authority
JP
Japan
Prior art keywords
voice
signal
noise
microphone
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP58130677A
Other languages
English (en)
Inventor
昇 塚本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP58130677A priority Critical patent/JPS6022193A/ja
Publication of JPS6022193A publication Critical patent/JPS6022193A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 本発明は、発声されたW葉を認識する音声認識装置に関
する。
近年、コンピュータや各種制御装置等における入力装置
として音声認識装置が本格的実用期を向かえるに至って
いる。人間の話す言葉をそのまま認識できる音声認識装
置は、利用のだめの特別な訓練もめらず、視線や手足が
拘束されないなど数々の利点があることは既に周知の通
りである。しかしながら、このような利点の反面、装置
を使用する周囲騒音により、認識性能が大きく影響を受
けるという欠点があることも事実である。特にランダム
に発生する衝撃音は認識装置に及ばず性能低下の影響が
大きく、問題となっている。
音声認識装置では、周囲騒音の影響を少なくする目的で
ノイズキャンセリング型のマイクロホンを使用している
のが一般的であり、ノイズキャンセリング型のマイクロ
ホンを使用することにより周囲騒音のレベルは減少し、
有効であるが、音声レベルの小さな領域では、なおかつ
周囲騒音の影響を受けてしまう。すなわちこの音声レベ
ルの小さな領域とは、特に発声された音声の始端、終端
部分に存在し、音声区間を検出することに対し大きな障
害となっていた。又、騒音に影響を受けない、スロート
マイクや、イヤーマイクの使用も考えられるがこれらの
マイクロホンの場合音声の高い周波数部分の特徴が得ら
れにくいことから認識率、が、静かな所で使用した通常
のマイクロホンに比較して明らかに低く、この方法も、
又、問題の解決には至っていない。
周囲騒音は、定常的なものと、非定常なものとに分ける
ことができる。定常的なものは、その騒音が85d13
(5)位筐でならば、認識性能には#1とんど影響を受
けない。これは、あらかじめ発声していない時に定常騒
音のレベルを把握できることによる。それに比べ非定常
なものは、発生する騒音の時期、大きさが分らず、この
種の騒音の影響を受けないで認識するということは難し
い。
本発明の目的は、発声した言葉の音声区間を外部騒音に
影響されることなく、安定して正確に捉えることができ
安定した高い認識性能が得られる音声認識装置を提供す
ることである。
本発明によれば、音声認識のために使用している発声に
よる空気振動をピックアップするマイクロホンの他に発
声に伴って人体に生じる振動をピックアップするスロー
トマイクあるいはイヤーマイク等を使い認識部に入力す
る音声入力を限定する音声認識装置が得られる。
以下、本発明を図を用いて詳細に説明する。図1は、実
用化されている音声認識装置の信号入力部のブロック図
である。オペレータにより発声された言葉は、空気振動
に変換され空気中を伝搬し、マイクロホン100K入力
され周波数分析部200でサンプリングされいくつかの
周波数チャンネルごとにディジタル化され、音声検出部
300で入力された信号が音声か否か分析される。
次に音声検出のメカニズム例を図2により説明する。一
般に入力された信号は、そのエネルギーのレベル値によ
り音声の検出を行っている。入力信号レベルがTHIを
超え以降の時間tとの積分値がTH2を超えている時に
音声の始端検出としている。同様に音声の終端検出は、
入力信号レベルがTH3以下になり、なおかっTH3以
下になった時点より時間t2の間連続してT H3以下
の状態であったとき行っている。この始端、終端レベル
は音声区間中での信号レベルに比較すると相当に小さな
値となっている。従って周囲騒音との関係を見ると始端
、終端付近に騒音が入る事がレベル的に最も影響を受け
る。又、時間方向上から見ても始端、終端が1ス”して
音声区間が真実のものより長くなり、発声した言葉のパ
ターンと異ったものとして捉えられることになる。これ
に比べ、始端、終端近傍以外の部分は、騒音が混入して
もその影響は比較的少ない。このことから周囲騒音に関
しては、音声区間の始端、終端を正しく検出できれば認
識性能の改善に大きく寄与することがわかる。
図3は本発明の一実施例である。一般の音声認識装置で
使用されている接話型マイクロホンエ00の入力信号4
01が入力信号コントロール部400に入力される。こ
の信号は図のように波形の前後にある山形の部分が周囲
騒音をひろった信号である。又、人体からの音声信号を
スロートマイク550よりピックアップしたものが信号
501であり、周囲騒音の影響は全くないものである。
信号501は、あらかじめ決められたスレッショルドレ
ベルによりスライサ一部500でスライスされ信号50
2として出力される。この信号502は、接話型マイク
ロホンからの入力信号をゲートコントロールするゲート
信号として使用される。
信号502が″H″レベルの時のみ入力信号401が認
識部450に出力されることになる。402はこの出力
信号であり、入力信号401での周囲騒音の信号部分が
取シ除かれたものである。このように従来のマイクロホ
ンからの入力信号の他に人体からの音声信号を音声区間
検出用として使用することによシ、周囲騒音に全く影響
されない音声認識装置を実現することが可能である。
本実施例は、人体からの音声信号を音声区間検出用とし
て特に始端、終端部の影響を除去する目的のみ使用して
いるが、さらに発声中での騒音の影響を除去する目的か
ら接話型マイクロホンからの信号と人体からの音声信号
のエネルギー値の相関をとるなどの手法で、さらに高認
識性能の音声認識装置を実現することも可能である。
44、図面の簡単な説明 図1は、現状の音声認識装置の信号入力部のブロック図
例である。図2は、音声検出のメカニズム例を表わす音
声入力波形である。図3は、本発明の一実施例である。

Claims (1)

    【特許請求の範囲】
  1. 認識されるべき音声を入力する第一のマイクロホンと、
    音声を発声する発声源の振動を取らえる第二のマイクロ
    ホンと、前記第二のマイクロホンの出力に応じて前記第
    一のマイクロホンの出力をゲートする制御部とを具備し
    、前記制御部の出力を受けて音声認識を行うことを特徴
    とする音声認識装置。
JP58130677A 1983-07-18 1983-07-18 音声認識装置 Pending JPS6022193A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58130677A JPS6022193A (ja) 1983-07-18 1983-07-18 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58130677A JPS6022193A (ja) 1983-07-18 1983-07-18 音声認識装置

Publications (1)

Publication Number Publication Date
JPS6022193A true JPS6022193A (ja) 1985-02-04

Family

ID=15039969

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58130677A Pending JPS6022193A (ja) 1983-07-18 1983-07-18 音声認識装置

Country Status (1)

Country Link
JP (1) JPS6022193A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63278100A (ja) * 1987-04-30 1988-11-15 株式会社東芝 音声認識装置
WO2005067340A1 (ja) * 2004-01-09 2005-07-21 Asahi Kasei Kabushiki Kaisha 体内伝導音マイクロフォン、信号処理装置、コミュニケーションインタフェースシステム、採音方法
JP2008172409A (ja) * 2007-01-10 2008-07-24 Yamaha Corp 収音装置及び音声伝送システム
JP2010010869A (ja) * 2008-06-25 2010-01-14 Audio Technica Corp マイクロホン装置

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63278100A (ja) * 1987-04-30 1988-11-15 株式会社東芝 音声認識装置
WO2005067340A1 (ja) * 2004-01-09 2005-07-21 Asahi Kasei Kabushiki Kaisha 体内伝導音マイクロフォン、信号処理装置、コミュニケーションインタフェースシステム、採音方法
US7778430B2 (en) 2004-01-09 2010-08-17 National University Corporation NARA Institute of Science and Technology Flesh conducted sound microphone, signal processing device, communication interface system and sound sampling method
JP2008172409A (ja) * 2007-01-10 2008-07-24 Yamaha Corp 収音装置及び音声伝送システム
JP2010010869A (ja) * 2008-06-25 2010-01-14 Audio Technica Corp マイクロホン装置

Similar Documents

Publication Publication Date Title
Zhu et al. On the use of variable frame rate analysis in speech recognition
EP0077194B1 (en) Speech recognition system
US20210256971A1 (en) Detection of replay attack
WO2017113370A1 (zh) 声纹检测的方法和装置
JPS6022193A (ja) 音声認識装置
JP2701431B2 (ja) 音声認識装置
JP3649032B2 (ja) 音声認識方法
US20080228477A1 (en) Method and Device For Processing a Voice Signal For Robust Speech Recognition
Fukuda et al. Improved voice activity detection using static harmonic features
KR100574883B1 (ko) 비음성 제거에 의한 음성 추출 방법
JPH0475520B2 (ja)
JPH03114100A (ja) 音声区間検出装置
JP2666296B2 (ja) 音声認識装置
JPS63278100A (ja) 音声認識装置
Alwan et al. Human and machine recognition of nasal consonants in noise
Vijayendra et al. Word boundary detection for Gujarati speech recognition using in-ear microphone
JPS61292699A (ja) 音声通過フイルタ
Bulbuller et al. In-ear microphone speech data segmentation and recognition using neural networks
JPS59170894A (ja) 音声区間の切り出し方式
JPS58120298A (ja) 摩擦音検出装置
JP2020134840A (ja) 音声認識装置及び音声認識装置の最適化方法
JPS6029796A (ja) 音声認識装置
JP2891259B2 (ja) 音声区間検出装置
JPS638699A (ja) バズ音検出装置
CN111445912A (zh) 语音处理方法和系统