JPH02262199A - 環境モニタ付音声認識装置 - Google Patents

環境モニタ付音声認識装置

Info

Publication number
JPH02262199A
JPH02262199A JP1081414A JP8141489A JPH02262199A JP H02262199 A JPH02262199 A JP H02262199A JP 1081414 A JP1081414 A JP 1081414A JP 8141489 A JP8141489 A JP 8141489A JP H02262199 A JPH02262199 A JP H02262199A
Authority
JP
Japan
Prior art keywords
environment
noise
voice
camera
section
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1081414A
Other languages
English (en)
Inventor
Hiroyuki Senbon
千本 浩之
Hiroshi Kanazawa
博史 金澤
Yoichi Takebayashi
洋一 竹林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP1081414A priority Critical patent/JPH02262199A/ja
Publication of JPH02262199A publication Critical patent/JPH02262199A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔発明の目的〕 (産業上の利用分野) 本発明は、特にノイズの多い環境下で使用する環境モニ
タ付音声認識装置に関する。
(従来の技術) 近年、マンマシン・インターフェースとして音声認識・
合成の技術の向上が目覚しく、荷物の区分け、券売機等
に音声認識装置が使用されている。
しかし、現在の音声認識装置の多くは、使用する環境の
ノイズが大きくなると認識率が低下する。
また、ノイズ対策としては、音声が入力されていない時
に、音声パワーによりノイズレベルを判断する等がある
が、どんな環境のノイズなのか、発声者がマイクからど
のくらいはなれているか等を監視する機能を持つものは
なく、ノイズに強い認識を行なう事ができないという問
題が生じた。
(発明が解決しようとする課題) この様に、従来の音声認識装置では、マイクからの入力
情報のみでノイズの大きさ、種類などを判定し、ノイズ
対策を行なうという音のメディアのみで対応をしていた
。この為、非定常的な雑音、例えば駅構内で列車の発着
にともなう人の移動の際のノイズ等を、すばやく感知す
る事ができないという問題が生じた。
本発明は、このような事情を鑑みてなされたももので、
その目的とするところは、カメラにより音声認識装置の
使用環境をモニタし、周囲の環境に適応した音声認識装
置を提供することにある。
〔発明の構成〕
(課題を解決するための手段) 本発明板体る音声認識装置は、マイクからの音z メディアの情報のみでノイズ対策を行なうのでなく、カ
メラのモニタからの画像メディアの情報も並用してノイ
ズの対策を行なう手段を備えている。
(作 用) 本発明によれば、音声認識装置がカメラにより使用環境
、周囲の環境をモニタし、人通りが多くなりだしたり、
多数の人が近づいてきたりした場合、ノイズが大きくな
る事を予想し、自動的に入力の音声をしぼったり、その
様な環境で使用しようとする人間がいた場合、近づいて
しゃべる様に指示したり、人通りに合わせてノイズがふ
くまれたりファレンスパタンを用いて認識を行なう様に
なり認識誤りをへらすことができる。
(実施例) 以下、図面を参照しながら本発明の一実施例について説
明する。第1図は本発明の第1の実施例に係る音声認識
装置のブロック図である。本音声認識装置は、カメラ1
、環境判定部2、ノイズ対策部3、音声入力部4、音響
分析部5、音声認識部6、辞書部7、スイッチ部8、音
声合成部9、音声出力部IOより構成されている。
次に本音声認識装置の動きについて説明する。
まず、カメラ1で周囲の環境をモニタする。例えば駅の
券売機の音声認識装置を考えた場合、改札口の様子をカ
メラ1でモニタし、例えば多数の乗降客が改札口から券
売機の方に向かってくる場合、環境判定部2で多数の人
が近づいてくるのを察知し、脚台や話し声がふえると判
定する。さらに近づいてくる人数が多いと判断されると
、ノイズ対策部3にその情報が送られる。ノイズ対策部
3では、環境判定部2で送られてきた情報を基にノイズ
に対する対策を考える。例えば、人の数か多くない時は
、音声入力部4の入力をしぼる。また人数が多く、かつ
使用者が音声入力部4のマイクから離れている事をカメ
ラ1で確認した場合、ノイズ対策部3では、音声入力部
4をしぼるだけでなく、スイッチ部8により音声認識部
6で認識する際の辞書7を、人の通りの多い場合のノイ
ズをまぜた辞書を使う様にスイッチングし、さらに音声
合成部9で近づくようにアナウスする文、例えば「まわ
りがうるさいので近くによって下さい」の様な文を合成
し、音声出力部10で音声出力を行ない、使用者に注意
をうながす。
また、カメラ1で使用者が十分に音声入力部1のマイク
に近づいているが、声が小さく、かつ、周囲がうるさく
なると判定されノイズ対策部3て音声入力部の入力をし
ぼった場合、音声認識部6からノイズ対策部3に認識不
可能の情報が送られる。この情報をノイズ対策部3では
音声合成部9に送り、音声合成部9では「声が小さすぎ
ます。
もう少し大きな声でもう1度御願いします」の様な文を
合成し、音声出力部10より使用者に注意をうながす。
次に本発明の第2の実施例について第2図、第3図を参
照しながら説明する。第2図は、第3図模式図の様に道
端にある自動販売機に音声認識装置を付けた場合の音声
認識装置のブロック図である。全体の処理の流れは第1
の実施例と同じだが、カメラ11で、自動販売機の前に
ある道をモニタする。第3図(a) 、 (b)の様に
乗用車あるいはトラックが近づいてきた事がカメラによ
りモニタされると、まず車種・速度判定部12で例えば
乗用車かトラックか緊急車両かを判定し、その速度を判
定する。これにより、乗用車がゆっくり走ってきた場合
、ノイズはそれほど大きくない事が予想される。
またこれとは逆に]・ラックが早いスピードで走ってき
た場合、ノイズが大きくなる事が予想される。
さらに緊急車両がサイレンをならして近づいてきた場合
、その速度を判定する事により、サイレンの音がドプラ
ー効果によりどう変化し、そのスペクトルの変化を推測
する事ができる。これらの情報をノイズ対策部13に送
り、ノイズ対策部では、上記の予測情報を基に、ノイズ
対策として音声入力部14で入力をしぼる、音声認識部
1Gでサイレンなどのノイズをスペクトルサブトラクシ
ョンをする、辞書をかえる、音声合成によりマイクに近
づくか、入力を待つ様に指示する等の使用者に注意をう
ながす等を行なう。
次に本発明箱3の実施例について第4図、第5図を参照
しながら説明する。第4図は、第5図の模式図の様に音
声認識装置を展示会で使用する場合のブロック図で全体
の処理の流れは第1、第2の実施例と同様であるか、カ
メラ21で音声認識装置の周囲の混雑をモニタする。一
方、カメラ22では隣りのブースのステージあるいは近
くのステージをモニタする。例えば、ステージ」二で人
影がなく、装置の前は混雑している。この様な場合は、
人数判定部23では人数は多い、ステージ判定部24で
はステージで何もやっていないという判定し、ノイズ対
策部25ではこの2つの情報を基にノイズ対策を行なう
。一方、ステージ上に人影がうつるとこれから説明が行
なわれる為、うるさくなるとステージ判定部24で予測
し、この情報をノイズ対策部25に送り、ノイズ対策を
行なう。
上記実施例によれば、ノイズの発生の予想をマイクがノ
イズをひろうまえに行なう事が可能であり、またノイズ
の種類を音のメディアだけでなく画像メケイアから確認
、推Millが可能であり、従来の音のメディア情報の
みを用いたノイズ対策にくらべ一段とすぐれたものにな
る。
なお、本発明は、上記実施例に限定されるものではない
。例えばノイズの発生するだろう場所ず複数の場合、そ
の数だけカメラを設置する事も可能である。このほか音
声認識方式、合成方式、動画像処理等は、従来より知ら
れた方式を適宜採用すればよい。
〔発明の効果〕
以」二の様に、本発明によれば、音声認識装置の使用環
境を音のメディアたけでなく、画像のメディアからも測
定し、認識誤りを起こす前にノイズ対策を行なう事が、
可能であるので、非定常のノイズの多い環境下でも従来
の方式に比べ、高い認識率の得られる音声認識装置を提
供できる。
【図面の簡単な説明】
第1図は本発明の第1の実施例に係る環境モニタ付音声
認識装置のブロック図、第2図は第2の実施例に係る環
境モニタ付音声認識装置のブロック図、第3図は第2の
実施例に係る使用環境の模式図、第4図は第3の実施例
に係る環境モニタ付音声認識装置のブロック図、第5図
は第3の実施例に係る使用環境の模式図である。 1・・・カメラ、    2・・・環境判定部、3・・
・ノイズ対策部、 4・・・音声入力部、5・・・音響
分析部、  6・・・音声認識部、7・・・辞書部、 
   8・・・スイッチ部、9・・・音声合成部、  
10・・・音声出力部。 代理人 弁理士 則 近 憲 佑 同  松山光之 (a) 第【− (b)

Claims (3)

    【特許請求の範囲】
  1. (1)音声を入力するための手段と、入力された音声を
    分析する手段と、分析結果から入力音声を認識する手段
    を有した音声認識装置において、音声入力される環境を
    モニタする手段と、モニタされる環境に対しノイズの発
    生源を監視しノイズ対策を行なう手段とを具備したこと
    を特徴とする環境モニタ付音声認識装置。
  2. (2)環境のモニタ情報は、音声入力の方向に対する物
    の動き、流量、使用者の発声位置を確認するものである
    請求項1記載の環境モニタ付音声認識装置。
  3. (3)音声認識の結果ノイズにより認識が不可能の場合
    、モニタする手段によりノイズを発生している物を動き
    からさがし、そのモニタ結果からノイズ対策が行なわれ
    るものである請求項1記載の環境モニタ付音声認識装置
JP1081414A 1989-04-03 1989-04-03 環境モニタ付音声認識装置 Pending JPH02262199A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1081414A JPH02262199A (ja) 1989-04-03 1989-04-03 環境モニタ付音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1081414A JPH02262199A (ja) 1989-04-03 1989-04-03 環境モニタ付音声認識装置

Publications (1)

Publication Number Publication Date
JPH02262199A true JPH02262199A (ja) 1990-10-24

Family

ID=13745683

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1081414A Pending JPH02262199A (ja) 1989-04-03 1989-04-03 環境モニタ付音声認識装置

Country Status (1)

Country Link
JP (1) JPH02262199A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1998029864A1 (fr) * 1996-12-26 1998-07-09 Sony Corporation Appareil et procede de reconnaissance, et appareil et procede d'apprentissage
CN107863106A (zh) * 2017-12-12 2018-03-30 长沙联远电子科技有限公司 语音识别控制方法及装置
CN117095674A (zh) * 2023-08-25 2023-11-21 广东福临门世家智能家居有限公司 智能门窗的交互控制方法及系统

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1998029864A1 (fr) * 1996-12-26 1998-07-09 Sony Corporation Appareil et procede de reconnaissance, et appareil et procede d'apprentissage
US6396954B1 (en) 1996-12-26 2002-05-28 Sony Corporation Apparatus and method for recognition and apparatus and method for learning
CN107863106A (zh) * 2017-12-12 2018-03-30 长沙联远电子科技有限公司 语音识别控制方法及装置
CN117095674A (zh) * 2023-08-25 2023-11-21 广东福临门世家智能家居有限公司 智能门窗的交互控制方法及系统
CN117095674B (zh) * 2023-08-25 2024-03-26 广东福临门世家智能家居有限公司 智能门窗的交互控制方法及系统

Similar Documents

Publication Publication Date Title
Foggia et al. Audio surveillance of roads: A system for detecting anomalous sounds
Badshah et al. Deep features-based speech emotion recognition for smart affective services
US9230538B2 (en) Voice recognition device and navigation device
CN109792577B (zh) 信息处理设备、信息处理方法和计算机可读存储介质
JP6977004B2 (ja) 車載装置、発声を処理する方法およびプログラム
WO2021169742A1 (zh) 交通工具运行状态的预测方法、装置、终端及存储介质
JP6466385B2 (ja) サービス提供装置、サービス提供方法およびサービス提供プログラム
KR20170120326A (ko) 음향 추적 정보 제공 방법, 차량용 음향 추적 장치, 및 이를 포함하는 차량
CN111325386A (zh) 交通工具运行状态的预测方法、装置、终端及存储介质
Foggia et al. Car crashes detection by audio analysis in crowded roads
US20220122592A1 (en) Energy efficient custom deep learning circuits for always-on embedded applications
JP2018030499A (ja) 車外情報提供装置および車外情報提供方法
WO2021101821A1 (en) Active transit vehicle classification
Cheng et al. Spectrogram-based classification on vehicles with modified loud exhausts via convolutional neural networks
JPH061549A (ja) エレベーターの音声案内装置
JPH02262199A (ja) 環境モニタ付音声認識装置
JP2647207B2 (ja) エレベータの呼び登録装置
JPH02308299A (ja) 環境モニタ付音声認識装置
JP6626549B1 (ja) 判定装置および判定方法
CN114834456A (zh) 向车辆的驾驶员提供辅助信息的方法和装置
US20240112677A1 (en) Motor vehicle and method for summarizing a conversation in a motor vehicle
JP7476965B2 (ja) 通知制御装置、制御方法、及びプログラム
JP5047900B2 (ja) 発話区間検出装置
Tsurufuji et al. A voice activated car audio system
JP2712692B2 (ja) 信号制御装置