JPH04184495A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPH04184495A
JPH04184495A JP2315439A JP31543990A JPH04184495A JP H04184495 A JPH04184495 A JP H04184495A JP 2315439 A JP2315439 A JP 2315439A JP 31543990 A JP31543990 A JP 31543990A JP H04184495 A JPH04184495 A JP H04184495A
Authority
JP
Japan
Prior art keywords
section
voice
output
speech
circuit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2315439A
Other languages
English (en)
Inventor
Hiroyuki Kiyamazawa
木山沢 弘之
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Seiko Epson Corp
Original Assignee
Seiko Epson Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Seiko Epson Corp filed Critical Seiko Epson Corp
Priority to JP2315439A priority Critical patent/JPH04184495A/ja
Publication of JPH04184495A publication Critical patent/JPH04184495A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [産業上の利用分野] 本発明は、音声認識装置に関する。
[従来の技術] 従来2発話者が発話した音声をマイクロフォンから入力
して、その音声信号から音声区間を検出して音声認識を
行う、音声認識装置においては。
第2図に示すように、マイクロフォンから入力された信
号の、比較的レベルが低い部分を検出するか、あるいは
9発話直前の周囲の雑音を取り込んで、その信号レベル
と比較することによって、音声区間を検出していた。
[発明が解決しようとする課題及び目的]しかし、従来
の方法では2周囲の騒音による影響を受は易く、騒音レ
ベルの大きいところでは使用できなかった6本発明は、
かかる問題点に鑑みて成されたもので、その目的とする
ところは2周囲の雑音のレベルによらず、容易に音声区
間の検出を可能にすることである。
[課題を解決する手段] 本発明の音声認識装置は2発話者が発話した音声をマイ
クロフォンから入力して、その音声信号から音声区間を
検出して音声認識を行う、音声認識装置において2発話
者の唇と、基準となる点との距離を測定する距離センサ
と、前記距離センサの出力の変化量を求める。微分回路
と、前記微分回路の出力を整流する整流回路と、前記整
流回路の出力を平滑化する。平滑回路と、前記平滑回路
の出力と、基準値を比較することによって、音声区間を
検出する。音声区間検出部と、前記音声区間検出部の出
力を受けて、前記マイクロフォンから入力された音声デ
ータに、音声区間を示すデータを付加して出力する。音
声区間切り畠し部と。
前記音声区間切り比し部の出力を、音声として認識し、
認識結果を出力する。認識部を有することを特徴とする
[作用] 本発明の音声認識装置の作用について説明すると、第1
図の機能ブロック図に示すように、1の距離センサで2
発話者の唇をとの距離を測り、その信号を2の微分回路
へ送る。ここで1発話者の唇との距離の変化量が求めら
れ、その結果が3の整流回路に送られる。ここでは、微
分回路の出力を整流する。その後、この信号は、4の平
滑回路で、高調波成分を除去され、6の音声区間検圧部
へ送られる。ここで、入力された信号と基準値とを比較
し、その結果を、7の音声区間切り出し部へ送る。7の
音声区間切り出し部では、5の音声区間検出部の出力を
受けて、6のマイクロフォンから入力された音声を2区
間毎に分けて、8の認識部へ渡す、8の認識部では、7
の音声区間切り出し部の出力を認識して、認識結果を出
力する。
[実施例] 以下に1本発明の音声認識装置の詳細を図示した実施例
に基づいて説明する。
第3図は1本発明の実施例を示す構成図である。
図中゛符号31は、距離センサである。32は微分回路
である。33は整流回路であり1本実施例ではダイオー
ドブリッジを使用して、全波整流している。34は平滑
回路であり、キャパシタを使用して、高調波成分を除去
している。35の点線で囲まれた部分が、音声区間検出
部であり、351のコンパレータ、352の可変抵抗か
ら構成されている。36はマイクロフォンである。37
の点線で囲まれた部分は、音声区間切り出し部であり。
371のA/D変換器と、372のバッファ制御回路と
、373のバッファ1と、374のバッファ2と、37
6のオアゲートで構成されている。
38は、音声を認識して結果を表示する。認識部である
次に、このように構成した装置の動作を、第3図に示し
た構成図に基づいて説明する。
31の距離センサは9発話者の唇と距離センサとの距離
を測ることによって、唇の動きを検出している。31の
距離センサの出力は、32の微分回路に送られる。ここ
で、31の距離の出力の変化量が検出される0次に、3
3のダイオードブリッジによって、全波整流され、34
のキャパシタで高調波成分を取り除かれた後、35の音
声区間検出部に送られる。このように、これらの回路を
通過して来るので、35の音声区間検出部に入力される
信号は1発話者の唇が動いている。即ち。
発話している間、一定態上のレベルを持つ、この信号と
、352の可変抵抗で設定された値とを。
351のコンパレータで比較し、入力された信号が、3
52の可変抵抗で設定された値(以下、スレショルドレ
ベルと云う)より大きければ、大きいことを示す値(以
下、レベル1と云う)を出力し、小さければ、小さいこ
とを示す値(以下、レベル2と云う)を高力する9本装
置が動作開始後。
最初に351のコンパレータから出力されるレベルlの
信号は、音声入力開始の信号となる。なお。
このスレショルドレベルは、31の距離センサ。
32の微分回路、33のダイオードブリッジのノイズレ
ベル、及び、34のキャパシタの容量に依存する。37
の音声区間切り出し部では、36のマイクロフォンで集
音した音声を、371のA/D変換器でデジタルデータ
に変換し、373のバッファ1.または、374のバッ
ファ2に記憶する。
372のバッファ制御回路は、35の音声区間検出部の
レベル1の出力を受けると、バッファ1゜あるいは、バ
ッファ2に記憶されている音声データを1つの音声区間
のデータとして、376のオアゲートを経て、38の認
識部へ出力する1本装置が動作を開始し、351のコン
パレータが出力する。最初のレベルlの信号が入力され
ゐと、その時点からの音声が最初の音声となり、バッフ
ァ1に記憶される。372のバッファ制御回路が。
351のコンパレータの次のレベル1の信号を受は取る
と、バッファ1に記憶された音声データを読みだし、3
8の認識部へ送る。同時に、374のバッファ2を、書
き込み状態に設定し1次に。
351のコンパレータから、レベル2の信号が入力され
るまで、374のバッファ2に音声データを書き込む、
これらの動作を、351のコンパレータのレベル1の信
号高力がある度に、切り替える。
尚2本発明に於て、距離センサは、唇の動きのみを検出
するようにする必要がある。そのため。
本実施例では、第4図に示すように、マイクロフォン装
置の43の集音ユニットが取り付けられている。42の
アーム部分に44の距離センサを取り付けているが、集
音ユニットと一体化することもできるし9発話者の頭部
と一体になって動く部分であれば、どこでも取り付ける
ことができる。
[発明の効果コ 以上説明したように2本発明によれば2周囲の騒音レベ
ルに全く影響されることなく、正確に。
音声区間を検出することができ、その効果は顕著である
【図面の簡単な説明】
第1図は2本発明の音声認識装置の構成を示す機能ブロ
ック図。 第2図は、従来例を示す機能ブロック図。 第3図は9本発明の実施例を示す構成図。 第4図は1本発明の、カメラとマイクロフォンの取り付
けの1例を示す概念図。 1 ・・・距離センサ 2・・・微分回路 3・・・整流回路 4・・・平滑回路 5・・・音声区間検出部 6・・・マイクロフォン 7・・・音声区間切り出し部 8・・・認識部 21・・・マイクロフォン 22・・・音声レベル検出部 23・・・音声区間切り出し部 24・・・認識部 31・・・距離センサ 32・・・微分回路 33・・・ダイオードブリッジ 34・・・キャパシタ 35・・・音声区間検出部 351・・・ コンパレータ 352・・・可変抵抗 36・・・マイクロフォン 37・・・音声区間切り出し部 371・・・A/D変換器 372・・・バッファ制御回路 373・・・バッファ1 374・・・バッファ2 376・・・オアゲート 38・・・認識部 41・・・発話者の口 42・・・マイクロフォン装置のアーム43・・・集音
ユニット 44・・・距離センサ 以  上 出願人 セイコーエプソン株式会社 ゛代理人 弁理士 鈴木喜三部 他1名第1図

Claims (1)

  1. 【特許請求の範囲】 a)発話者が発話した音声をマイクロフォンから入力し
    て、その音声信号から音声区間を検出して音声認識を行
    う、音声認識装置において、 b)発話者の唇と、基準となる点との距離を測定する距
    離センサと、 c)前記距離センサの出力の変化量を求める、微分回路
    と、 d)前記微分回路の出力を整流する整流回路と、 e)前記整流回路の出力を平滑化する、平滑回路と、 f)前記平滑回路の出力と、基準値を比較することによ
    って、音声区間を検出する、音声区間検出部と、 g)前記音声区間検出部の出力を受けて、前記マイクロ
    フォンから入力された音声データに、音声区間を示すデ
    ータを付加して出力する、音声区間切り出し部と、 e)前記音声区間切り出し部の出力を、音声として認識
    し、認識結果を出力する、認識部を有することを特徴と
    する、音声認識装置。
JP2315439A 1990-11-20 1990-11-20 音声認識装置 Pending JPH04184495A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2315439A JPH04184495A (ja) 1990-11-20 1990-11-20 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2315439A JPH04184495A (ja) 1990-11-20 1990-11-20 音声認識装置

Publications (1)

Publication Number Publication Date
JPH04184495A true JPH04184495A (ja) 1992-07-01

Family

ID=18065387

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2315439A Pending JPH04184495A (ja) 1990-11-20 1990-11-20 音声認識装置

Country Status (1)

Country Link
JP (1) JPH04184495A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002358089A (ja) * 2001-06-01 2002-12-13 Denso Corp 音声処理装置及び音声処理方法
JP2004509362A (ja) * 2000-07-19 2004-03-25 アリフコム 電子的信号からノイズを除去するための方法および装置
JP2005049876A (ja) * 2003-07-29 2005-02-24 Microsoft Corp ヘッドマウント型多感覚応用音声入力システム(headmountedmulti−sensoryaudioinputsystem)
JP2017046094A (ja) * 2015-08-25 2017-03-02 株式会社オーディオテクニカ 防音送話装置

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004509362A (ja) * 2000-07-19 2004-03-25 アリフコム 電子的信号からノイズを除去するための方法および装置
JP2011203755A (ja) * 2000-07-19 2011-10-13 Aliphcom 電子的信号からノイズを除去するための方法および装置
JP2002358089A (ja) * 2001-06-01 2002-12-13 Denso Corp 音声処理装置及び音声処理方法
JP2005049876A (ja) * 2003-07-29 2005-02-24 Microsoft Corp ヘッドマウント型多感覚応用音声入力システム(headmountedmulti−sensoryaudioinputsystem)
JP4703142B2 (ja) * 2003-07-29 2011-06-15 マイクロソフト コーポレーション ヘッドマウント型多感覚応用音声入力システム(headmountedmulti−sensoryaudioinputsystem)
JP2017046094A (ja) * 2015-08-25 2017-03-02 株式会社オーディオテクニカ 防音送話装置

Similar Documents

Publication Publication Date Title
US4239936A (en) Speech recognition system
US5579431A (en) Speech detection in presence of noise by determining variance over time of frequency band limited energy
JPS5852695A (ja) 車両用音声検出装置
JPS6060080B2 (ja) 音声認識装置
JPH04184495A (ja) 音声認識装置
Yoshinaga et al. Audio-visual speech recognition using new lip features extracted from side-face images
JPH04184496A (ja) 音声認識装置
JPH03114100A (ja) 音声区間検出装置
JPS6338993A (ja) 音声区間検出装置
JP3114757B2 (ja) 音声認識装置
JPH04181297A (ja) 音声認識装置
JP3008593B2 (ja) 音声認識装置
JPH01310399A (ja) 音声認識装置
JPS6242197A (ja) 音声区間検出方法
CA1127764A (en) Speech recognition system
KR940005047B1 (ko) 음성전이구간 검출기
JP2003271189A (ja) 話者方向検出回路及びその検出方法
JP3484559B2 (ja) 音声認識装置および音声認識方法
JP2882792B2 (ja) 標準パターン作成方式
JP2005107384A (ja) 音声認識装置および方法、プログラム並びに記録媒体
JPS63278100A (ja) 音声認識装置
JPS63118197A (ja) 音声検出装置
JPS6250800A (ja) 音声認識装置
JPH04181300A (ja) 音声認識装置
Oh et al. Endpoint detection of isolated Korean utterances for bimodal speech recognition in acoustic noisy environments