JPS60217396A - パタ−ン認識装置 - Google Patents

パタ−ン認識装置

Info

Publication number
JPS60217396A
JPS60217396A JP59072659A JP7265984A JPS60217396A JP S60217396 A JPS60217396 A JP S60217396A JP 59072659 A JP59072659 A JP 59072659A JP 7265984 A JP7265984 A JP 7265984A JP S60217396 A JPS60217396 A JP S60217396A
Authority
JP
Japan
Prior art keywords
recognition
microphone
input
recognition device
pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP59072659A
Other languages
English (en)
Inventor
浮田 輝彦
中村 好勝
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP59072659A priority Critical patent/JPS60217396A/ja
Publication of JPS60217396A publication Critical patent/JPS60217396A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Image Input (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔発明の技術分野〕 本発明は、パターン発生源と認識装置との位置関係が、
時間的にダイナミックに変化する状況におけるパターン
認識装置に関する。
〔発明の技術的背景とその問題点〕
パターン認識装置は、文字読取)装置や音声認識装置と
して実用化されている。その装置構成の典型的な例を第
1図に示す。
入力されるパターンは、カメラやマイクによシミ気信号
に変換されて、認識のための特徴パラ゛メータが前処理
として抽出される。次に認識単位毎に用意された辞書と
入カバターンとの類似度計算を行ない、最大類似度を与
えるカテゴリーを選択し、入カバターンはそのカテゴリ
ーに属するものと判定される。
しかしながら、カメラ+マイク等の信号入力部の設定は
操作員や発□声者自身が行なうため、そのための手間は
無視し難い上に、認識装置にとって最適に調整されてい
るかどうか判断するのが困難な場合が多かった。とりわ
けパターン発生源と認識装置の入力部との位置関係が時
間的に変化する場合には、入力部の調整は難しい課題で
あり、操作員の勘にたよる場合が多い。例えば、音声認
識装置を券売機等に利用する場合を考えれば、券購入者
すなわち発声者によシ、背の高さが異なるため当然口の
位置も大人と子供では大きく異なる。
このような状況では、マイクの方向や位置を変化させな
くては、認識処理に十分なSN比を確保することが難か
しいため、従来実用化されている音声認識装置では、高
精度な認識が難しかった。
このような事情は信号入力部がロボットなどに登載され
、その位置が変化する場合も全く同じであシ、パターン
発生源と入力部との相対位置関係を検出し、入力条件を
設定する手段をパターン認識装置が持たない限シ、従前
の装置では全く無力であった。
〔発明の目的〕
本発明は上記の従来装置の欠点を改良したもので、パタ
ーン発生源と認識装置の入力部との位置関係が時間的に
変化する状況においても、高精度に入カバターンを認識
できるパターン認識装置を提供することにある。
〔発明の概要〕
本発明では、認識結果及び前処理特徴パラメータ、或い
は、装置の位置を示す信号に基づいて、信号の入力条件
すなわち、入力手段の種別・位置・方向を変化させる。
〔発明の効果〕
このように、パターン認識装置が能動的に入力条件を設
定できる手段を持つことによシ、時間的に変化するパタ
ーン発生源の位置によらない最適な入力条件を保持する
ことが可能となる。
このことによってSハの優れた入力情報が得られ、認識
出力として誤認識ならびにその結果としての誤動作の発
生が低減し、信頼性を著しく向上する。最適入力条件設
定のための検出制御を必要とするが、認識論理は入力情
報の品質が良くなるため、より簡易な方式を採用するこ
と75:でき、システム全体の低価格化に効果的である
〔発明の実施例〕
第2図に本発明の一実施例装置の構成図を示す。
以下では、音声認識装置を例にとって説明するが、他の
文字認識装置などのパターン認識装置であっても、入力
手段が異なるだけである。
まず、発声された音声は、従来のパターン認識装置と同
様に信号入力部21によシミ気信号に変換される。次に
前処理部22により、その特徴パラメータであるスペク
トルやパワーが計算される。ここで音声パワーが充分な
大きさを持つならば、認識処理に十分なSNが与えられ
ているとして、従来の装置の如く、類似度計算を行ない
(23)、その結果最大類似度を与えるカテゴリー名を
判定・出力する(判定部24)。その際類似度計算には
、よく知られた動的計画法や複合類似度法を用いればよ
い。
一方、音声区間のパワーが充分でない時、すなわち数百
m5ecの区間の平均的パワーの値がある所定の閾値を
満さない場合、信号入力部210条件を調整する必要が
あるとして、信号入力条件設定部25が入力条件を変更
する。
入力条件の変更には、マイクの種別の変更、位置の変更
、方向の変更の3種がある。マイクの種別は、指向性の
異なり具合により、無指向性、単一指向性、超指向性な
どがあシ、発声者のマイクからの距離に応じて区別すれ
ばよい。すなわち、背景雑音と音声区間のパワーの比に
より、8Nの比が大きくなる様に指向性が強いマイクに
順次切り換えればよい。また位置の変更は、マイクを固
定している支持台を空間的に移動させ、音声パワーの平
均値が大きくなるように設定する。その方法は、よく知
られている自動制御系として構成して、音声パワーの平
均値を制御パラメータとすれば実現できる。或いは位置
の異なるマイクを複数本用意しておき、各マイクから入
力される音声信号の平均パワーが最大のものを選び、そ
のマイクから入力される信号に基づいて認識処理を行な
ってもよい。マイクの方向の変更は、マイク位置の変更
と同様に自動制御系として構成すれば、音声パワー平均
値を制御パラメータとして、自動的に音源の方向を向く
ようにできる。これらのマイクの種別・位置・方向の変
更は、それぞれ単独に用いてもよいし、組み合せて用い
てもよい事は言うまでもない。
上に示した実施例では、音声パワーを用いて入力条件を
変更していたが、認識結果と併用して入力条件を変更す
ることも可能である。すなわち、類似度計算後の判定時
において、類似度値が十分高い値でない時は通常リジェ
クトするが、この場合にのみ入力条件を変更するように
することが可能である。このようにすれば、従来の装置
ではリジェクトされてしまうような場合、例えば発声者
がマイクから離れ過ぎている場合などでも、認識装置が
自動的に信号入力手段やその条件を変更するため、問題
なく認識処理できる。
一方空間的に移動するロボット等の機械にマイクが設置
されている場合には、機械がどのように移動したかを示
す信号を用いることが可能である。
この場合には、音源は一定位置に存在すると仮定し、機
械位置変化信号に基づいてマイクの方向や位置又は種別
を変更することは簡単に実現できる。
第3図にその実施例を示す。第2図と異なる点は、信号
入力手段位置変化信号が外部から与えられている点にあ
る。
上記の実施例では、音声認識装置を例として説明したが
、他のパターン認識装置、例えば文字認識装置、画像認
識装置における場合においても同様に考えられる。
例えば、読取領域に対してその領域を囲む規格化された
四辺形のマークを検知し、その観測像、つまシマークの
歪、大きさから、被観測物体と観測認識装置の相対的方
向、位置関係が明らかになる。この観測結果から相対的
方向、位置を最適なしむるよう移動し、観測方向を修正
し、観測倍率をズーミングすることにより、観測像とし
て正規化された像を得ることが出来る。このような手段
方法にて、前述マークが正しく観測されたことをもって
、最適化をなし、必要とする文字、マーク等の観測、認
識処理を行なうことができ、認識アルゴリズムが簡易か
つ、信頼性の高いもの認識装置を実現できる。
ここで四辺形のマークを例としたが、円でも、さらに立
体形にても同様の検出、信号入力条件最適化が可能であ
る。
立体形を用いる場合にはカラー情報を付加することによ
シ、よシ高精度、簡易に最適化することも可能である。
1方規格マーク、物体等から観測の最適化を計る外に、
水蒸気、煙等の検知後において、当該部分の温度分布像
を観測、危険の程度を認識する場合等の応用場面におい
て、前述観測系に赤外線フィルターの挿入を行なうか否
かの制御を行ない、観測像の最適化を計ることも、効果
的に実現できる。
【図面の簡単な説明】
第1図は従来装置の典型的な構成を示す図、第2図及び
第3図は、本発明の実施例を示す図である。 11・・・信号入力手段、12・・・前処理手段、13
・・・類似度計算手段、14・・・判定手段、21・・
・信号入力手段、22・・・前処理手段、23・・・類
似度計算手段、24・・・判定手段、25・・・入力条
件設定手段、 31・・・信号入力手段、32・・・前処理手段、33
・・・類似度計算手段、34・・・判定手段、35・・
・入力条件設定手段。

Claims (2)

    【特許請求の範囲】
  1. (1)入力信号のパターンを認識する装置において、認
    識結果または前処理特徴パラメータの少なくとも一方に
    基づいて信号入力条件を能動的に設定する手段を具備す
    ることを特徴とするパターン認識装置。
  2. (2)設定手段は、時間的に変化する装置の位置・方向
    に関する信号を受けとれに基づき信号入力条件を設定す
    ることを具備することを特徴とする特許請求の範囲第1
    項記載のパターン認識装置。
JP59072659A 1984-04-13 1984-04-13 パタ−ン認識装置 Pending JPS60217396A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59072659A JPS60217396A (ja) 1984-04-13 1984-04-13 パタ−ン認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59072659A JPS60217396A (ja) 1984-04-13 1984-04-13 パタ−ン認識装置

Publications (1)

Publication Number Publication Date
JPS60217396A true JPS60217396A (ja) 1985-10-30

Family

ID=13495720

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59072659A Pending JPS60217396A (ja) 1984-04-13 1984-04-13 パタ−ン認識装置

Country Status (1)

Country Link
JP (1) JPS60217396A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013108815A1 (ja) 2012-01-17 2013-07-25 独立行政法人産業技術総合研究所 ナノフィラーを混合した炭素繊維強化プラスチック材料およびその製造方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013108815A1 (ja) 2012-01-17 2013-07-25 独立行政法人産業技術総合研究所 ナノフィラーを混合した炭素繊維強化プラスチック材料およびその製造方法

Similar Documents

Publication Publication Date Title
CN106710603B (zh) 利用线性麦克风阵列的语音识别方法及系统
CN106653041B (zh) 音频信号处理设备、方法和电子设备
US20060104454A1 (en) Method for selectively picking up a sound signal
EP2428951B1 (en) Method and apparatus for performing microphone beamforming
JP4847022B2 (ja) 発声内容認識装置
CN1288223A (zh) 用于语音控制的适应方向性特征的装置
US20020069054A1 (en) Noise suppression in beam-steered microphone array
CN206349145U (zh) 音频信号处理设备
JP2000356674A (ja) 音源同定装置及びその同定方法
JP7194897B2 (ja) 信号処理装置及び信号処理方法
CN108073381A (zh) 一种对象控制方法、装置及终端设备
CN113014844A (zh) 一种音频处理方法、装置、存储介质及电子设备
JPH06351015A (ja) テレビジョン会議システム用の撮像システム
US5884254A (en) Method and apparatus for restricting microphone acceptance angle
KR101976937B1 (ko) 마이크로폰 어레이를 이용한 회의록 자동작성장치
JPS60217396A (ja) パタ−ン認識装置
RU174044U1 (ru) Аудиовизуальный многоканальный детектор наличия голоса
Nakadai et al. Footstep detection and classification using distributed microphones
JPH10243494A (ja) 顔方向認識方法及び装置
Nakadai et al. Exploiting auditory fovea in humanoid-human interaction
JP2006304125A (ja) 音声信号補正装置および音声信号補正方法
CN113631942A (zh) 声源跟踪控制方法和控制装置、声源跟踪系统
CN109994124A (zh) 一种吸油烟机的语音筛选方法
EP0274427A2 (en) Detector circuit and sensor
JP2712704B2 (ja) 信号処理装置