JP2878712B2 - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JP2878712B2
JP2878712B2 JP1146517A JP14651789A JP2878712B2 JP 2878712 B2 JP2878712 B2 JP 2878712B2 JP 1146517 A JP1146517 A JP 1146517A JP 14651789 A JP14651789 A JP 14651789A JP 2878712 B2 JP2878712 B2 JP 2878712B2
Authority
JP
Japan
Prior art keywords
recognition
voice
speaker
speech
output
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP1146517A
Other languages
English (en)
Other versions
JPH0311400A (ja
Inventor
淳一 岩崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP1146517A priority Critical patent/JP2878712B2/ja
Publication of JPH0311400A publication Critical patent/JPH0311400A/ja
Application granted granted Critical
Publication of JP2878712B2 publication Critical patent/JP2878712B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Description

【発明の詳細な説明】 [発明の目的] (産業上の利用分野) 本発明は、発話者の音声を確実に集収して音声認識す
ることのできる音声認識装置に関する。
(従来の技術) 従来の音声認識装置では、ホストシステム(あるいは
制御部)から認識開始命令を受取ることにより、認識動
作を開始し、これ以降に入力された音声を認識するよう
になっている。
実際の音声認識装置では、この認識開始命令を受けて
認識を開始してから発話者が発声するまでのタイミング
の設定が難しく、マン・マシン・インタフェースの改善
が問題となっている。
そこで、最近では、音声を入力する音声入力手段(マ
イクロフォンなど)の近傍にセンサ(光センサ、超音波
センサ、その他)を設置し、このセンサが発話者の近接
を検出すると、発話者に対して発声要求を出力(表示出
力、合成音声出力など)し、同時に認識開始命令を出力
して認識を開始するようにしたものもある。
(発明が解決しようとする課題) 上記したように、センサによって発話者の近接を検出
してから発声要求を出力し、音声認識処理を開始してい
たため、発話者が発声要求が出力されるよりも前に発声
を開始してしまうと、認識開始時に音声の先頭部分が取
りこぼされてしまい、結果として誤認識あるいはリジェ
クトとなる。
しかし、発話者としては発声している間に発声要求が
出力されていることが多いため、自分の発声開始が早す
ぎるという意識がなく、それ故、再入力する場合にも、
前回と同様に発声要求が出力される前に発生してしまう
ことが多い。
このようなことを防止する方法として、接近検出感度
の高いセンサや、発話者の近接を2段階に検出するセン
サを用いることにより、装置と発話者との距離情報を利
用して発声要求を少し早い時点で出力して、認識処理を
開始してしまうことも考えられる。しかしながら、この
ような手段を用いても、発話者がセンサの直線的な検出
領域に対して横切るようにして接近した場合は、前述と
同じ現象が発生し、発話者の装置への側面からの接近に
対処するためにセンサがもう1つ必要となる。
このように従来にあっては、発話者の様々な発声状況
に対処する上で、発声音を如何にして正確に取込むかと
いう点で課題が残されている。
そこで、本発明は、発話者の音声の先頭部分を取りこ
ぼすことなく正確に認識することのできる音声認識装置
を提供することを目的とする。
[発明の構成] (課題を解決するための手段) 本発明の音声認識装置は、音声を入力する音声入力手
段と、この音声入力手段の近傍に設けられ、上記音声入
力手段への発話者の近接を検出する発話者検出手段と、
上記音声入力手段へ音声が入力される都度、その入力さ
れる音声の認識処理を開始すると共に認識処理開始を示
す認識処理開始情報を出力し、しかる後に認識処理の実
行により得られた認識結果を出力する音声認識手段と、
この音声認識手段から認識処理開始情報が出力された場
合には、上記音声認識手段から認識結果が出力されるの
を待って当該認識結果を受信し、それ以前に上記記発話
者検出手段により発話者の近接が検出されていたときに
限り、上記受信した認識結果を発話者の入力音声の認識
結果として出力手段により発話者に提示する制御手段と
を具備している。
(作用) 本発明によれば、音声入力手段の近傍にて音声が入力
される都度、その音声に対して認識処理を開始するの
で、発話者の音声の先頭部分を取りこぼすことなく認識
することができる。その上で制御手段は、音声認識手段
からの認識処理開始情報により当該音声認識手段が認識
処理を開始したことを検出すると、当該音声認識手段か
ら認識結果が出力されるのを待ってその認識結果を受信
し、それ以前に発話者の近接が検出されていたときに限
り、この受信した認識結果、つまり発話者の近接を検出
した以降に音声認識手段から出力された認識結果を発話
者に提示するので、発話者の様々な発声状況に対処する
ことが可能となる。
(実施例) 以下、本発明の一実施例について図面を参照して説明
する。
第1図において、1は音声を入力する音声入力手段と
してのマイクロフォンで、2はマイクロフォン1の近傍
に設けられる近接センサ(発話者検出手段)である。近
接センサ2は、たとえば超音波センサや静電センサなど
があるが、この実施例では、たとえば反射形の光学式セ
ンサが用いられている。このセンサ2により、マイクロ
フォン1の前方の所定の距離範囲内に物体(たとえば発
話者)が対峙したか否かが検出される。
音声認識部(音声認識手段)3は、第2図にその動作
フローチャートを示すように、マイクロフォン1から入
力された音声の電気信号が入力されると、その音声の認
識処理を開始し、同時に認識処理を開始したことを示す
認識処理開始情報を制御部4に送るとともに、入力音声
の認識処理を実行し、得られた認識結果を制御部4へ送
り、音声認識部3の1回の認識処理を終了する。
制御部4は、音声認識部3から送られる認識処理開始
情報によって、センサ2による検出結果の監視を開始
し、発話者の近接が検出されれば、音声認識部3から送
られる認識結果を出力部5によって発話者に提示出力す
る、あるいは、音声認識部3から送られる認識結果に基
づいて所定の処理を行なう。
センサ2によって発話者の近接が検出されない場合に
は、音声認識部3に入力された音声はマイクロフォン1
から離れたままの発声あるいは雑音であるとみなして、
制御部4は、このとき音声認識部3から送られてきた認
識結果は出力部5に提示出力せず、処理を終了する。
すなわち、制御部4は、第3図にその動作フローチャ
ートを示すように、音声認識部3の処理開始と同時にセ
ンサ2によるマイクロフォン1への発話者の近接を監視
し、音声認識部3から認識結果を受取るまでにセンサ2
が発話者の近接を検出すれば、その認識結果を発話者の
入力音声に対する認識結果として出力部5にて提示出力
し、所定の処理を行なう、あるいは、センサ2が発話者
を検出しなければ認識結果を出力しない。という一連の
音声認識処理を音声がマイクロフォン1へ入力される都
度、実行する。
なお、ここで説明した音声認識装置の実施例では、発
話者に発声要求を出力することなく実現できる例を示し
たが、本発明による音声認識装置では、ディスプレイや
合成音声などの発声要求出力手段をも具備し、センサ2
が発話者の近接を検出すると同時に、この出力手段に発
声要求を出力するという構成も実現可能である。
[発明の効果] 以上詳述したように本発明の音声認識装置によれば、
音声入力手段へ音声が入力される都度、その音声に対し
て認識処理を開始するので、たとえ発話者が発話者検出
手段の検出領域内に到達するよりも少し前に発声を開始
しても、その音声の先頭部分を取りこぼすことなく、正
確に認識することができき、その上で音声認識処理を行
なっている間、発話者検出手段よって発話者の近接を監
視し、近接を検出した時のみそれ以降の音声認識結果を
発話者の音声の認識結果とみなして出力するので、発話
者としては発声のタイミングを考慮する必要がないた
め、使い勝手が非常に向上する。
【図面の簡単な説明】
図は本発明の一実施例を示すもので、第1図は音声認識
装置の概略図、第2図は音声認識処理の流れを示すフロ
ーチャート、第3図は制御部の処理の流れを示すフロー
チャートである。 1…マイクロフォン(音声入力手段)、2…近接センサ
(発話者検出手段)、3…音声認識部(音声認識手
段)、4…制御部、5…出力部。

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】音声を入力する音声入力手段と、 この音声入力手段の近傍に設けられ、前記音声入力手段
    への発話者の近接を検出する発話者検出手段と、 前記音声入力手段へ音声が入力される都度、その入力さ
    れる音声の認識処理を開始すると共に認識処理開始を示
    す認識処理開始情報を出力し、しかる後に認識処理の実
    行により得られた認識結果を出力する音声認識手段と、 この音声認識手段から前記認識処理開始情報が出力され
    た場合には、前記音声認識手段から認識結果が出力され
    るのを待って当該認識結果を受信し、それ以前に前記記
    発話者検出手段により発話者の近接が検出されていたと
    きに限り、前記受信した認識結果を発話者の入力音声の
    認識結果として出力手段により発話者に提示する制御手
    段と を具備したことを特徴とする音声認識装置。
JP1146517A 1989-06-08 1989-06-08 音声認識装置 Expired - Lifetime JP2878712B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1146517A JP2878712B2 (ja) 1989-06-08 1989-06-08 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1146517A JP2878712B2 (ja) 1989-06-08 1989-06-08 音声認識装置

Publications (2)

Publication Number Publication Date
JPH0311400A JPH0311400A (ja) 1991-01-18
JP2878712B2 true JP2878712B2 (ja) 1999-04-05

Family

ID=15409439

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1146517A Expired - Lifetime JP2878712B2 (ja) 1989-06-08 1989-06-08 音声認識装置

Country Status (1)

Country Link
JP (1) JP2878712B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2683690B1 (fr) * 1991-11-08 1994-01-28 Serge Rihiant Dispositif de communication auditive.
JP2017144521A (ja) * 2016-02-18 2017-08-24 ソニー株式会社 情報処理装置、情報処理方法、及びプログラム

Also Published As

Publication number Publication date
JPH0311400A (ja) 1991-01-18

Similar Documents

Publication Publication Date Title
EP3414759B1 (en) Techniques for spatially selective wake-up word recognition and related systems and methods
US6505155B1 (en) Method and system for automatically adjusting prompt feedback based on predicted recognition accuracy
US7801726B2 (en) Apparatus, method and computer program product for speech processing
WO2007138503A1 (en) Method of driving a speech recognition system
KR20090054642A (ko) 음성 인식 방법 및 장치
JP6827536B2 (ja) 音声認識装置および音声認識方法
JP6459330B2 (ja) 音声認識装置、音声認識方法、及び音声認識プログラム
CN111402880A (zh) 一种数据处理方法、装置及电子设备
JPH0831021B2 (ja) 音声ガイダンス出力制御方法
JP2807241B2 (ja) 音声認識装置
JP2878712B2 (ja) 音声認識装置
JPH1124694A (ja) 命令認識装置
JP2829014B2 (ja) 音声認識装置及び方法
JPH0635497A (ja) 音声入力装置
JPS62150295A (ja) 音声認識方法
JP2001343983A (ja) 音声始端検出方法、音声認識装置における音声区間検出方法および音声認識装置
JP6748565B2 (ja) 音声対話システム及び音声対話方法
JP3940895B2 (ja) 音声認識装置及び方法
JP3360978B2 (ja) 音声認識装置
JPH02178699A (ja) 音声認識装置
JP2737109B2 (ja) 音声区間検出方式
JPH02103599A (ja) 音声認識装置
JPH03160499A (ja) 音声認識装置
KR100194764B1 (ko) 전화 버튼을 이용한 음성 인식 시스템 및 음성 인식 결과 확인 방법
JPH04184495A (ja) 音声認識装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080122

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090122

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100122

Year of fee payment: 11

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100122

Year of fee payment: 11