JPH02131300A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPH02131300A
JPH02131300A JP63285504A JP28550488A JPH02131300A JP H02131300 A JPH02131300 A JP H02131300A JP 63285504 A JP63285504 A JP 63285504A JP 28550488 A JP28550488 A JP 28550488A JP H02131300 A JPH02131300 A JP H02131300A
Authority
JP
Japan
Prior art keywords
speaker
voice
proximity sensor
microphone
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP63285504A
Other languages
English (en)
Other versions
JP2807241B2 (ja
Inventor
Nobuo Sugi
杉 伸夫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP63285504A priority Critical patent/JP2807241B2/ja
Publication of JPH02131300A publication Critical patent/JPH02131300A/ja
Application granted granted Critical
Publication of JP2807241B2 publication Critical patent/JP2807241B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [発明の目的] (産業上の利用分野) 本発明は発話者の音声を確実に収集して音声認識するこ
とのできる音声認識装置に関する。
(従来の技術) 近時、種々の機器に音声認識装置を組込み、発話者が発
声した命令等の音声をマイクロホンを介して取込んでそ
の入力音声を認識処理し、その認識結果に従って種々の
情報処理を実行することが種々試みられている。例えば
ワードプロセッサにおける文書情報人力手段や、プラン
ト等における制御命令人力手段、更には種々の券売機で
における情報人力手段等として音声認識装置の利用が注
目されている。
ところでこの種の音声入力装置にあっては、周囲雑音等
の悪影響を受けることなしに情報入力目的とする音声だ
けを確実に入力し、これを音声認識することがその認識
性能を高める上で重要な課題となる。しかして音声認識
処理は、一般にその制御部(ホスト計算機)からの認識
開始コマンドを受けて開始されるが、実際のシステムで
は音声認怠処理の開始のタイミングを適切に設定するこ
とが非常に難しい。そこで従来では、一般的に発話者が
発声した音声を入力する為のマイクロフォンの近傍位置
に超音波センサ等の近接センサを設け、この近接センサ
により発話者の顔(口元)とマイクロフォンとの近接状
態を検出し、例えば発話者の顔がマイクロフォンに十分
に近付いたことが検出されたときに認識開始コマンドを
発し、その後、音声の入力開始を指示する旨のメッセー
ジを出力するようにしている。またこの近接センサにて
発話者の顔がマイクロフォンから離れていることが検出
されたときには、顔(口)をマイクロフォンに近付けて
発声する旨をメッセージ出力し、良好な音声人力状態を
確保するものとなっている。
ところがこのようにして近接センサを用いてマイクロフ
ォンと発話者の顔との近接状態を検出して音声認識処理
の動作を制御し、発話者に対して音声入力に関するメッ
セージを出力して音声入力のタイミングやその入力姿勢
を指示するにも拘らず、発話者によってはマイクロフォ
ンに十分に近付かない状態で、或いはマイクロフォンに
十分に近付いたとしても音声入力開始のメッセージが出
力される前に発話を開始してしまうことが多々ある。こ
のような場合には、音声認識の開始コマンドが与えられ
て音声認識処理が開始される以前に音声入力がなされる
ことになるので、音声認識装置にはその先頭部分が欠落
した状態で音声が人力されることになる。この結果、誤
認識や認識リジエクトが発生し、発話者に音声の再入力
を促すことが必要となり、発話者のみならず音声認識装
置にとっても徒に負担が増える。
特に発話の開始が発生要求のタイミングより伜かに早い
だけの場合には、発話者自身に発声タイミングが早いと
云う意識がない為、音声の再入力時にも同様にしてその
先頭部分が欠落してしまうことが多いと云う問題がある
このような不具合を解消する為に、近接センサの感度を
高めておき、発話者がマイクロフォンに近付いてくる途
中のタイミングで認識開始コマンドを与えることが考え
られている。しかしこのような対策を講じた場合、発話
者がマイクロフォンに十分に近付かない状態で発話開始
することについての対策を講じることができなくなり、
誤認識や認識リジエクトが増える原因となる。また上述
した感度の高い近接センサを用い、発話者が近付くこと
を検出した後、一定時間を経て発話要求を発することも
考えられているが、そのタイミング設定が非常に難しく
、また発話者がマイクロフォンに十分近付いたか否かを
検出することができないと云う問題がある。
(発明が解決しようとする課題) このように従来にあっては、発話者がマイクロフォンに
十分に近付いたことを検出し、先頭部分の欠落を生じる
ことなく上記発話者からの音声を取込んで認識する等で
、認識処理開始のタイミング等を適切に設定することが
非常に困難でありた.。
本発明はこのような事情を考慮してなされたもので、そ
の目的とするところは、発話者が発声する音声をその先
頭部分の欠落を生じることなく確実に入力して音声認識
することのできる音声認識装置を提供することにある。
(課題を解決するための手段) 本発明は、筺体に設けられたマイクロフォンにより発話
者が発声した音声を人力して音声認識する際、上記マイ
クロフォンの近傍位置に設けられた近接センサにより前
記発話者の顔と上記マイクロフォンとの近接状態を検出
し、この近接状態に応じて発話者に音声入力に関するメ
ッセージを出力するようにした音声認識装置に係り、前
記近接センサとは別に前記筺体に発話者が近付いたこと
を検出する為の補助近接センサを設け、この補助近接セ
ンサにより発話者の近接状態が検出されたとき、前記マ
イクロフォンから入力される音声に対する音声認識処理
を開始させるようにしたことを特徴とするものである。
つまり近接センサによる検出結果に従って音声人力のタ
イミング等を促すに先立って、補助近接センサによる検
出結果に従って音声認識処理を開始させておくようにし
たことを特徴とするものである。
(作 用) 本発明によれば、近接センサによる検出結果に従って音
声入力のタイミング等を促すに先立って補助近接センサ
により発話者の近接を検出し、この検出結果に従って音
声認識処理を開始させておくので、発話者の発声開始タ
イミングが早い場合であっても、その先頭部分の欠落を
生じることなく発話音声を確実に取込んで音声認識する
ことが可能となる。
この結果、非常に簡易にして効果的に誤認識や認識リジ
ェクトの発生を抑えてその認識効率を高めることが可能
となる。
(実施例) 以下、図面を参照して本発明の一実施例に係る音声認識
装置につき説明する。
第1図は実施例装置の要部概略構成図であり、第2図は
その制御処理シーケンスを示す図である。
第1図においてlは各種認識方式を採用して構成される
音声認識部である。この音声認識部1は制御部2からの
認識開始コマンドを受けて音声認識処理を開始し、マイ
クロフォン3から入力される音声を認識処理し、その認
識結果を出力する。
しかしてこれらの音声認識部lおよび制御部2は、一般
的には各種情報処理装置本体の筺体4内に組込まれて設
けられ、前記マイクロフォン3は上記筺体4の所謂操作
パネル面に設けられる。
このマイクロフォン3を設けた操作パネル面には、発話
者Aに対して音声入力に関する種々のメッセージを表示
する表示器5や、上記マイクロフォン3への発話者Aの
顔(口元)の近接を検出する為の近接センサ(第1の近
接センサ)6が上記マイクロフォン3の近傍位置に設け
られている。
前記制御部2は、基本的にはこの近接センサ(第1の近
接センサ)6により発話者Aの顔(口元)のマイクロフ
ォン3に対する近接状態を検出し、この検出結果(近接
状態)に応じて前記表示器5を用いて音声入力に関する
種々のメッセージを提示出力する。この表示器5に表示
されるメッセージは、例えば 『音声入力を開始して下さい。』 『もつとマイクロフォンに近付いて 発声して下さい。        』 等のメッセージからなる。尚、音声合成装置等を用いて
これらのメッセージを音声出力することも勿論可能であ
る。
しかして本装置が特徴とするところは、上述した構成に
加えて前記筺体4に補助近接センサ(第2の近接センサ
)7を設け、前記近接センサ(第1の近接センサ)6に
より発話者Aの顔(口元)がマイクロフォン3に近付い
たことが検出される以前に、その発話者Aが本装置(筺
体4)に近接したことを検出するようにした点にある。
そしてこの補助近接センサ(第2の近接センサ)7によ
る検出結果に従い、近接センサ(第1の近接センサ)6
により発話者Aの顔(口元)がマイクロフォン3に近付
いたことが検出されるに先立って、前記制御部2から音
声認識部lに対して認識開始コマンドを与え、認識処理
を開始させるようにした点にある。
このような本装置の特徴ある動作を第2図を参照して説
明すると、先ず補助近接センサ(第2の近接センサ)7
にて発話者Aが本装置(筺体4−)に所定の距離範囲内
に近接したか否かを検出し、その近接状態を監視する(
ステップa)。そして発話者Aが本装置(筺体4)に所
定の距離範囲内(例えば30cm程度)に近接したこと
が上記補助近接センサ(第2の近接センサ)7にて検出
されたとき、制御部2から音声認識部1に対して認識開
始コマンドを出力し(ステップb)、音声認識部lにそ
の音声認識処理動作を開始させる(ステップC)。
この状態で次に前記近接センサ(第1の近接センサ)6
にて発話者Aの顔(口元)がマイクロフォン3に対して
所定の距離範囲内(例えばl Ocm程度)に近接した
か否かを調べる(ステップd)。
尚、この近接センサ(第1の近接センサ)6による発話
者Aの顔(口元)のマイクロフォン3に対する近接検出
は、前記補助近接センサ(第2の近接センサ)7による
発話者Aの近接検出タイミングから所定時間内に発話者
Aの顔(口元)がマイクロフォン3に近接したか否かを
監視しながら行なわれ(ステップe)、所定時間内にそ
の近接が検出されない場合には(タイムアウト時)、前
記表示器5を用いてマイクロフォンに対して顔を近付け
る旨のメッセージを出力する(ステップf)。
この所定時間は、一般的には2〜3秒程度に設定すれば
十分である。
このような制御手続きを経て発話者Aの顔がマイクロフ
ォン3に十分に近付いたことが検出されたとき(ステッ
プd)、前記表示器5を用いて音声人力を開始を促す旨
のメッセージを出力する(ステップg)。そしてこのメ
ッセージに従って発声される音声を入力処理し(ステッ
プh)、その入力音声について前記音声認識部lにて認
識処理を実行させる(ステップi)。そしてその認識結
果を前記音声認識部lから制御部2に対して転送し(ス
テップj)、適宜発話者に対してその認識結果の確認表
示を行なう等して、一連の音声認識処理制御を終了する
かくしてこのように構成され、且つ上述したように制御
処理動作する本装置によれば、発話者Aが近付いた時点
で音声認識部lにおける認識処理を開始させ、その後、
発話者Aがマイクロフォン3に近付いた時点で音声人力
の開始を促す旨をメッセージ出力するので、仮に発話者
Aの発声開始タイミングがそのメッセージ表示のタイミ
ングよりも僅かに早くても、その先頭部分の欠落を招く
ことなく入力音声を音声認識部lに取込んで認識処理を
行なわせることが可能となり、発話者Aが発声した音声
を確実に認識することが可能となる。
従って先頭部分の欠落に起因する誤認識や認識リジエク
トの発生をなくし、その認諏効率を高めることが可能と
なる。また先頭部分の欠落に起因する誤認識や認識リジ
エクトがない分だけ発話者Aに対して音声の再入力を促
す頻度が減るので、発話者に対する負担の軽減を図り得
ると共に、装置自体にとってもその処理負担の軽減を図
ることが可能となる。
また実施例装置によれば、発話者Aがマイクロフォン3
に近接していない状態が検出されたとき、適宜注意を促
すメッセージを出力することができるので、これによっ
て安定な音声人力状況を効果的に確保することが可能と
なる。
つまり2つの近接センサ6,7によりその機能を分担し
て担わせ、これらの近接センサB.7による状態検出結
果に従って音声認識処理を制御するので、発話者Aが発
生した音声を確実に認識することが可能となる。
尚、本発明は上述した実施例に限定されるものではない
。例えば発話者の近接距離をアナログ的に段階を以て検
出し得る近接センサ(距離測定器)を用いることにより
、上述した2つの機能を実質的に1つのセンサに担わせ
ることも可能である。
またここでは音声認識部lとその$ila1部2とを筺
体4内に収容した構造のものについて説明したが、マイ
クロフォン3や近接センサ6,7とその筺体を分離して
設けることも勿論可能である。またここで採用される音
声認識方式自体については特に限定されないことも云う
までもなく、要はその要旨を逸脱しない範囲で種々変形
して実施することができる。
[発明の効果] 以上説明したように本発明によれば、発話者がマイクロ
フォンに近付くことが検出される先立って音声認識処理
を開始させるようにその制御が行なわれるので、発話者
の発声タイミングが早い場合であってもその先頭部分の
欠落を生じることなく、その発話音声を確実に認識する
ことができる等の実用上多大なる効果が奏せられる。
【図面の簡単な説明】
図は本発明の一実施例に係る音声認識装置につき示すも
ので、第1図は実施例装置の要部概略構成図、第2図は
その制御・処理シーケンスを示す図である。 ■・・・音声認識部、2・・・制御部、3・・・マイク
ロフォン、4・・・筺体、5・・・表示器、6・・・近
接センサ(第1の近接センサ)、7・・・補助近接セン
サ(第2の近接センサ)

Claims (1)

  1. 【特許請求の範囲】 筺体に設けられたマイクロフォンにより発話者が発声し
    た音声を入力して音声認識するに際し、上記マイクロフ
    ォンの近傍位置に設けられた近接センサにより前記発話
    者の顔と上記マイクロフォンとの近接状態を検出し、こ
    の近接状態に応じて発話者に音声入力に関するメッセー
    ジを出力するようにした音声認識装置において、 前記筺体に発話者が近付いたことを検出する為の補助近
    接センサを設け、この補助近接センサにより発話者の近
    接状態が検出されたとき、前記マイクロフォンから入力
    される音声に対する音声認識処理を開始させることを特
    徴とする音声認識装置。
JP63285504A 1988-11-11 1988-11-11 音声認識装置 Expired - Fee Related JP2807241B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63285504A JP2807241B2 (ja) 1988-11-11 1988-11-11 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63285504A JP2807241B2 (ja) 1988-11-11 1988-11-11 音声認識装置

Publications (2)

Publication Number Publication Date
JPH02131300A true JPH02131300A (ja) 1990-05-21
JP2807241B2 JP2807241B2 (ja) 1998-10-08

Family

ID=17692386

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63285504A Expired - Fee Related JP2807241B2 (ja) 1988-11-11 1988-11-11 音声認識装置

Country Status (1)

Country Link
JP (1) JP2807241B2 (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08185196A (ja) * 1994-12-28 1996-07-16 Sony Corp 音声区間検出装置
EP0939534A1 (en) * 1998-02-27 1999-09-01 Nec Corporation Method for recognizing speech on a mobile terminal
EP0999542A1 (en) * 1998-11-02 2000-05-10 Ncr International Inc. Methods of and apparatus for hands-free operation of a voice recognition system
JP2002108390A (ja) * 2000-09-27 2002-04-10 Sharp Corp 音声認識装置及びコンピュータ読み取り可能な記録媒体
WO2002050818A1 (en) * 2000-12-19 2002-06-27 Nokia Corporation A method for activating context sensitive speech recognition in a terminal
JP2016029466A (ja) * 2014-07-16 2016-03-03 パナソニック インテレクチュアル プロパティ コーポレーション オブアメリカPanasonic Intellectual Property Corporation of America 音声認識テキスト化システムの制御方法および携帯端末の制御方法
US11394862B2 (en) 2020-02-05 2022-07-19 Canon Kabushiki Kaisha Voice input apparatus, control method thereof, and storage medium for executing processing corresponding to voice instruction
US11600277B2 (en) 2020-02-05 2023-03-07 Canon Kabushiki Kaisha Voice input apparatus, control method thereof, and storage medium for executing processing corresponding to voice instruction

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08185196A (ja) * 1994-12-28 1996-07-16 Sony Corp 音声区間検出装置
EP0939534A1 (en) * 1998-02-27 1999-09-01 Nec Corporation Method for recognizing speech on a mobile terminal
EP0999542A1 (en) * 1998-11-02 2000-05-10 Ncr International Inc. Methods of and apparatus for hands-free operation of a voice recognition system
JP2002108390A (ja) * 2000-09-27 2002-04-10 Sharp Corp 音声認識装置及びコンピュータ読み取り可能な記録媒体
WO2002050818A1 (en) * 2000-12-19 2002-06-27 Nokia Corporation A method for activating context sensitive speech recognition in a terminal
JP2016029466A (ja) * 2014-07-16 2016-03-03 パナソニック インテレクチュアル プロパティ コーポレーション オブアメリカPanasonic Intellectual Property Corporation of America 音声認識テキスト化システムの制御方法および携帯端末の制御方法
US11394862B2 (en) 2020-02-05 2022-07-19 Canon Kabushiki Kaisha Voice input apparatus, control method thereof, and storage medium for executing processing corresponding to voice instruction
US11600277B2 (en) 2020-02-05 2023-03-07 Canon Kabushiki Kaisha Voice input apparatus, control method thereof, and storage medium for executing processing corresponding to voice instruction

Also Published As

Publication number Publication date
JP2807241B2 (ja) 1998-10-08

Similar Documents

Publication Publication Date Title
US11683632B2 (en) Automatic speech recognition triggering system
JP3674990B2 (ja) 音声認識対話装置および音声認識対話処理方法
JP2009178783A (ja) コミュニケーションロボット及びその制御方法
JPH02131300A (ja) 音声認識装置
JP7330066B2 (ja) 音声認識装置、音声認識方法及びそのプログラム
WO2021021970A1 (en) Activating speech recognition
WO2018216180A1 (ja) 音声認識装置および音声認識方法
JP2007155986A (ja) 音声認識装置および音声認識装置を備えたロボット
JP3838159B2 (ja) 音声認識対話装置およびプログラム
JP2647207B2 (ja) エレベータの呼び登録装置
JP2008052178A (ja) 音声認識装置と音声認識方法
US20180350360A1 (en) Provide non-obtrusive output
JPH0635497A (ja) 音声入力装置
JPH02184915A (ja) 音声認識装置及び方法
JP2010206365A (ja) 対話装置
JP2007171637A (ja) 音声処理装置
JP2878712B2 (ja) 音声認識装置
JPH02103599A (ja) 音声認識装置
JP3757638B2 (ja) 音声認識方法及び音声認識装置並びに音声認識処理プログラムを記録した記録媒体
JP3846500B2 (ja) 音声認識対話装置および音声認識対話処理方法
JP7449070B2 (ja) 音声入力装置、音声入力方法及びそのプログラム
KR102456438B1 (ko) 인공지능을 활용한 비주얼 웨이크 업 시스템
US11308966B2 (en) Speech input device, speech input method, and recording medium
JP2003241794A (ja) 音声認識装置及び方法
KR102052634B1 (ko) 호출음 인식장치 및 호출음 인식방법

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees