JPH05333899A - 音声入力装置、音声認識装置および警報発生装置 - Google Patents

音声入力装置、音声認識装置および警報発生装置

Info

Publication number
JPH05333899A
JPH05333899A JP4138947A JP13894792A JPH05333899A JP H05333899 A JPH05333899 A JP H05333899A JP 4138947 A JP4138947 A JP 4138947A JP 13894792 A JP13894792 A JP 13894792A JP H05333899 A JPH05333899 A JP H05333899A
Authority
JP
Japan
Prior art keywords
output
voice
input device
type microphone
voice input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP4138947A
Other languages
English (en)
Inventor
Shoji Fujimoto
昇治 藤本
Kazuya Sako
和也 佐古
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Denso Ten Ltd
Original Assignee
Denso Ten Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Denso Ten Ltd filed Critical Denso Ten Ltd
Priority to JP4138947A priority Critical patent/JPH05333899A/ja
Publication of JPH05333899A publication Critical patent/JPH05333899A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Alarm Systems (AREA)

Abstract

(57)【要約】 【目的】 騒音環境下で使用した場合にも認識率を向上
することの可能な音声入力装置と、この音声入力装置を
前処理装置として使用する音声認識装置および警報発生
装置を提供する。 【構成】 骨伝導型マイクロフォン41の出力はディジ
タルフィルタ43に導かれ、遅延部44を通過した接話
型マイクロフォン42の出力を参照信号としてイコライ
ジングされる。フィルタ43の係数は係数調整部46に
よってフィルタ43の出力と遅延部44の出力の差が最
小となるように調整される。即ち騒音除去性能に優れて
はいるが高音域の特性の劣る骨伝導型マイクロフォンで
集音された音声信号が高音域でも特性の優れた接話型マ
イクロフォンで集音された音声信号に基づいてイコライ
ジングされるため、音声入力装置の出力として騒音の除
去された高音域まで平坦な特性を有する音声信号が出力
される。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は音声で操作指令を入力す
る音声入力装置の係わり、特に騒音環境下においても正
確な操作指令を入力することのできる音声入力装置に関
する。
【0002】
【従来の技術】音声による情報入力は、キーボードに代
表される従来の入力方法と比較すると、 (1)人間にとって最も自然は入力方法である。 (2)入力に際して特別な訓練が不要である。
【0003】(3)手および目が空くので、他の作業を
同時に行うことも可能となる。 等の利点を有するために実用化がすすんでいる。特に近
年、マイクロコンピュータに代表されるハードウエアの
進歩だけでなく、音声認識法等のソフトウエアも進歩し
たため、小包の仕分け作業あるいは生産ラインにおける
目視検査あるいは自動車において窓の開閉操作あるいは
電話のボタン操作等にも利用されている。
【0004】
【発明が解決しようとする課題】音声入力装置は生産現
場あるいは自動車内のように比較的暗騒音が大きい場所
で使用される場合が多く、音声の認識率を向上させるた
めには騒音成分を除去することが重要である。しかし従
来から使用されている帶域フィルタを使用した場合には
騒音は除去できるものの音声情報の位相も変化してしま
うため、かえって認識率を低下させてしまう。
【0005】また頭蓋骨の振動を直接検出する骨伝導マ
イクロフォンを使用することも考えられるが、この場合
は以下の問題を生じる。図8はマイクロフォンの利得特
性の一例を示すグラフであって、横軸に周波数を、縦軸
に利得をとる。そして実線は骨伝導型マイクロフォンの
特性を、破線は接話型マイクロフォンの特性を示す。
【0006】骨伝導型マイクロフォンおよび接話型マイ
クロフォンともに20Hz前後の重低音域では利得は低
下する。しかし接話型マイクロフォンは5KHz程度の
音域までほぼ平坦な利得特性を示すものの、骨伝導マイ
クロフォンは2KHz以上の音域で徐々に利得が低下す
る。
【0007】即ち骨伝導マイクロフォンはいわゆる暗騒
音を集音することはないが高音域においては徐々に利得
が低下し、骨伝導マイクロフォンの出力を直接音声認識
に使用した場合には高音域の情報の欠落のために認識率
を向上させることはできない。本発明はかかる問題点に
鑑みなされたものであって、騒音環境下で使用した場合
にも認識率を向上することの可能な音声入力装置と、こ
の音声入力装置を前処理装置として使用する音声認識装
置および警報発生装置を提供することを目的とする。
【0008】
【課題を解決するための手段】図1は第1の発明にかか
る音声入力装置の基本構成図であって、骨伝導型マイク
ロフォン11と、接話型マイクロフォン12と、骨伝導
型マイクロフォン11の出力を入力として骨伝導型マイ
クロフォン11で集音した音声の特性を補正する適応フ
ィルタリング手段13と、接話型マイクロフォン12の
出力を適応フィルタリング手段13における骨伝導型マ
イクロフォン11の出力の補正に要する処理時間より長
い時間遅延させる遅延手段14と、適応フィルタリング
手段13の出力と遅延手段14の出力とを減算する減算
手段15と、減算手段15の出力が略零となるように適
応フィルタリング手段13に含まれる係数を変更する係
数調整手段16と、から構成される。
【0009】図2は第2の発明にかかる音声認識装置の
基本構成図であって、音声入力装置10の後段に、音声
入力装置10の構成要素である適応フィルタリング手段
13の出力から音声区間を切り出す音声区間切り出し手
段21と、音声区間切り出し手段21で切り出された音
声区間の特徴を表す情報と予め登録されている特定の単
語の特徴を表す情報とを照合して該音声入力装置10に
入力された音声が予め登録されている特定の単語である
か否かを判断する単語照合手段22と、単語照合手段2
2で音声入力装置10に入力された音声が予め登録され
ている特定の単語であると判断された時に所定の認識信
号を出力する出力手段23と、を設ける。
【0010】図3は第3の発明にかかる警報発生装置の
基本構成図であって、音声入力装置10の後段に、音声
入力装置10の構成要素である減算手段15の出力を周
波数分析する周波数分析手段31と、周波数分析手段3
1で分析された減算手段15の出力の予め定められた特
定周波数帶域成分の増加率が予め定められた増加率しき
い値より大であるか否かを判断する増加率判断手段32
と、増加率判断手段32において減算手段15の出力の
予め定められた特定周波数帶域成分の増加率が予め定め
られた増加率しきい値より大であると判断された時に警
報を発生する警報発生手段33と、を設ける。
【0011】
【作用】第1の発明にかかる音声入力装置にあっては、
暗騒音の除去特性に優れてはいるものの音声特に高音帶
域の集音特性に劣る骨伝導マイクロフォンで集音された
音声信号が適応フィルタリング手段によって、接話型マ
イクロフォンで集音された音声信号を参照信号としてイ
コライジングされる。
【0012】従って適応フィルタリング手段からは暗騒
音が除去されかつ高音帶域まで特性の劣化しない音声信
号が出力される。第2の発明にかかる音声認識装置にあ
っては、音声入力装置で処理された暗騒音が除去されか
つ高音帶域まで特性の劣化しない音声信号に基づいて音
声認識がなされる。
【0013】第3の発明にかかる警報発生装置にあって
は、定常状態においては適応フィルタリング手段によっ
てイコライジングされた骨伝導マイクロフォンで集音さ
れた音声信号と接話型マイクロフォンで集音された音声
信号との減算結果は略零であるが、異常音を発生する音
源が急速に接近した場合には減算結果は急速に零から大
きく偏位することを利用して警報が発せられる。
【0014】
【実施例】図4は第1の発明にかかる音声入力装置の実
施例の機能線図であって、骨伝導型マイクロフォン41
の出力はいわゆるFIRディジタルフィルタを構成する
フィルタ部43に入力される。フィルタ部43はN個直
列接続された単位遅延要素4311、4312・・・4
31Nと、それぞれの単位遅延要素4311、4312
・・・431Nの出力に係数を乗ずるN個の係数要素4
321、4322・・・432Nと、N個の係数要素4
321、4322・・・432Nの出力を加算する加算
部433とから構成される。
【0015】接話型マイクロフォン42の出力は単位遅
延要素4211、4212・・・421Mが直列接続さ
れた遅延部44に入力される。フィルタ部43の出力お
よび遅延部44の出力は減算部45で減算され、その結
果は係数調整部46に導かれる。係数調整部46におい
ては減算部の減算結果の2乗平均値が最小となるように
例えば周知の最小2乗法あるいは学習同定法を使用して
N個の係数要素4321、4322・・・432Nに対
して係数の調整操作を実行する。
【0016】上記機能を有する音声入力装置は例えばD
SP(Digital Signal Proccessor)を使用して実現す
ることが可能である。なお遅延部44に含まれる単位遅
延時間要素の数Mはフィルタ部43に含まれる単位時間
要素の数Nより大とする必要がある。即ちフィルタ部4
3から安定した出力を得るためにはフィルタ部43での
遅延時間(単位遅延時間×N)の他に係数調整部46に
おいて係数調整操作に要する時間を見込む必要があるか
らである。
【0017】第1の発明にかかる音声入力装置において
は骨伝導型マイクロフォン41で集音された音声信号を
接話型マイクロフォン42で集音された音声信号を参照
信号としてイコライジングすることによって、骨伝導型
マイクロフォン41で集音された音声信号の高音域の特
性が補償される。従ってフィルタ部43の出力として騒
音が除去されかつ接話型マイクロフォンと同程度に高音
域まで平坦な周波数特性を有する音声信号を得ることが
可能となる。
【0018】図5は第2の発明にかかる音声認識装置お
よび第3の発明にかかる警報発生装置の実施例の構成図
であって、検査員50が例えば自動車である検査対象物
51を目視検査する場合を考える。検査員50のヘルメ
ット52には骨伝導型マイクロフォン41と接話型マイ
クロフォン42とが設置されており、これらの出力は検
査員50の例えば腰に取り付けられた音声入力装置53
1および送信器532が一体化された前処理装置53に
送られる。
【0019】音声入力装置531で処理された音声信号
はディジタル信号あるいはアナログ信号として送信器5
32から無線伝送される。受信器54で受信された音声
信号は例えばディジタルコンピュータである処理装置5
5に入力され処理される。そして処理装置55の処理結
果は出力装置56に送られる。
【0020】図6は第2の発明にかかる音声認識装置の
機能線図であって、第1の発明にかかる音声入力装置5
31のフィルタ部43の出力が送信器532に伝送さ
れ、高音域がイコライジングされた音声信号が無線伝送
される。なお音声入力装置531内の構成は図4に示す
音声入力装置と同一であり、同一番号は同一の構成要素
を表す。
【0021】受信器54で受信された音声信号は処理部
55に伝送される。処理部55は音声信号を区分けする
音声区間切り出し部551、切り出された音声信号中に
予め登録された単語が存在するか否かを判定する単語照
合部552および予め登録された単語が存在すると判定
された場合は認識信号を出力する出力部553から構成
される。
【0022】自動車を検査する本実施例においては、検
査員は外面に存在するキズを検査して製品番号と「キズ
あり」あるいは「キズなし」の判定結果とを入力するも
のとする。単語照合部552には予め数字、「キズあ
り」および「キズなし」という言葉の特徴を登録してお
く。
【0023】出力装置56は例えばプリンタであり、検
査員50の発音する製品番号を表す数字および「キズあ
り」あるいは「キズなし」の検査結果を印字する。即ち
第2の発明にかかる音声認識装置によれば、検査員は騒
音の大きい工場内において自動車の周囲を自由に動き回
りながら検査することが可能となる。図7は第3の発明
にかかる警報発生装置の機能線図であって、第1の発明
にかかる音声入力装置531の減算部45の出力が送信
部532に伝送され、フィルタ部43でイコライジング
された骨伝導型マイクロフォン41の出力と接話型マイ
クロフォンの出力との差信号である減算部45の出力が
送信器532に送られ無線伝送される。
【0024】受信器54で受信された差信号は処理部5
5に送られる。処理部55は、差信号を例えばFFTを
適用する周波数分析部556、特定の周波数帶域の増加
率が予め設定したしきい値より大となったか否かを判定
する増加率判定部557および増加率判定部557で特
定の周波数帶域の増加率がしきい値以上となったときに
警報を発生する警報発生部558から構成する。
【0025】即ち減算器45の出力は定常的な状態にあ
ってはフィルタ部43の係数が調整された結果差信号は
略零となっており、差信号を周波数分析された結果はほ
ぼ一定の形状を維持する。この状態で例えばクレーン等
の危険物が接近して定常状態とは相違する音声信号が入
力されると、差信号は零でなくなり周波数分析されたパ
ターンは定常状態とは相違したものとなる。
【0026】従って特定の周波数成分の増加率が所定の
しきい値以上となったことを検出すれば、危険物が接近
したことおよびある程度の種類を判定することが可能と
なる。この警報発生装置においては出力装置56は例え
ば警告灯であり検査員50の近傍に設置されている。
【0027】即ち警報発生部558から危険物が接近し
ている旨の信号が発せられると警告灯が点灯して検査員
に注意を促すことが可能となる。工場内は騒音があるこ
と、検査員はヘルメットを着用していて音を聞き取り難
いことから、第3の発明にかかる警報発生装置が有用と
なる。
【0028】
【発明の効果】第1の発明にかかる音声入力装置によれ
ば、骨伝導型マイクロフォンと接話型マイクロフォンと
を併用することにより騒音を十分に除去できるだけでな
く高音域まで平坦な利得特性を有する音声信号を得るこ
とが可能となる。また第2の発明にかかる音声認識装置
によれば、音声認識装置として公知のものを適用した場
合であっても、第1の発明にかかる音声入力装置で前処
理を行うことにより認識率を向上することが可能とな
る。
【0029】さらに第3に発明にかかる警報発生装置に
よれば、第1の発明にかかる音声入力装置で前処理を行
うことにより暗騒音の多い工場内に作業員に確実に危険
物の接近を警報することが可能となる。
【図面の簡単な説明】
【図1】図1は第1の発明にかかる音声入力装置の基本
構成図である。
【図2】図2は第2の発明にかかる音声認識装置の基本
構成図である。
【図3】図3は第3の発明にかかる警報発生装置の基本
構成図である。
【図4】図4は第1の発明にかかる音声入力装置の実施
例の機能線図である。
【図5】図5は音声認識装置および警報発生装置の実施
例の構成図である。
【図6】図6は第2の発明にかかる音声認識装置の実施
例の機能線図である。
【図7】図7は第3の発明にかかる音声認識装置の実施
例の機能線図である。
【図8】図8はマイクロフォンの利得特性をしめすグラ
フである。
【符号の説明】
11…骨伝導型マイクロフォン 12…接話型マイクロフォン 13…適応フィルタリング手段 14…遅延手段 15…減算手段 16…係数調整手段

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 骨伝導型マイクロフォン(11)と、 接話型マイクロフォン(12)と、 該骨伝導型マイクロフォン(11)の出力を入力として
    該骨伝導型マイクロフォン(11)で集音した音声の特
    性を補正する適応フィルタリング手段(13)と、 該接話型マイクロフォン(12)の出力を、該適応フィ
    ルタリング手段(13)における該骨伝導型マイクロフ
    ォン(11)の出力の補正に要する処理時間より長い時
    間遅延させる遅延手段(14)と、 該適応フィルタリング手段(13)の出力と該遅延手段
    (14)の出力とを減算する減算手段(15)と、 該減算手段(15)の出力が略零となるように該適応フ
    ィルタリング手段(13)に含まれる係数を変更する係
    数調整手段(16)と、から構成される音声入力装置。
  2. 【請求項2】 請求項1に記載の音声入力装置(10)
    の後段に、 該音声入力装置(10)の構成要素である前記適応フィ
    ルタリング手段(13)の出力から音声区間を切り出す
    音声区間切り出し手段(21)と、 該音声区間切り出し手段(21)で切り出された音声区
    間の特徴を表す情報と予め登録されている特定の単語の
    特徴を表す情報とを照合して該音声入力装置(10)に
    入力された音声が予め登録されている特定の単語である
    か否かを判断する単語照合手段(22)と、 該単語照合手段(22)で該音声入力装置(10)に入
    力された音声が予め登録されている特定の単語であると
    判断された時に所定の認識信号を出力する出力手段(2
    3)と、を設けることを特徴とする音声認識装置。
  3. 【請求項3】 請求項1に記載の音声入力装置(10)
    の後段に、 該音声入力装置(10)の構成要素である前記減算手段
    (15)の出力を周波数分析する周波数分析手段(3
    1)と、 該周波数分析手段(31)で分析された該減算手段(1
    5)の出力の予め定められた特定周波数帶域成分の増加
    率が予め定められた増加率しきい値より大であるか否か
    を判断する増加率判断手段(32)と、 該増加率判断手段(32)において該減算手段(15)
    の出力の予め定められた特定周波数帶域成分の増加率が
    予め定められた増加率しきい値より大であると判断され
    た時に警報を発生する警報発生手段(33)と、を設け
    ることを特徴とする警報発生装置。
JP4138947A 1992-05-29 1992-05-29 音声入力装置、音声認識装置および警報発生装置 Withdrawn JPH05333899A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4138947A JPH05333899A (ja) 1992-05-29 1992-05-29 音声入力装置、音声認識装置および警報発生装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4138947A JPH05333899A (ja) 1992-05-29 1992-05-29 音声入力装置、音声認識装置および警報発生装置

Publications (1)

Publication Number Publication Date
JPH05333899A true JPH05333899A (ja) 1993-12-17

Family

ID=15233878

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4138947A Withdrawn JPH05333899A (ja) 1992-05-29 1992-05-29 音声入力装置、音声認識装置および警報発生装置

Country Status (1)

Country Link
JP (1) JPH05333899A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20030040610A (ko) * 2001-11-15 2003-05-23 한국전자통신연구원 골 전도 마이크로 입력된 음성신호의 음질 향상방법
US20130246059A1 (en) * 2010-11-24 2013-09-19 Koninklijke Philips Electronics N.V. System and method for producing an audio signal
JP2014096732A (ja) * 2012-11-09 2014-05-22 Oki Electric Ind Co Ltd 収音装置及び電話機
JP2017028718A (ja) * 2016-09-14 2017-02-02 ソニー株式会社 耳孔装着型収音装置、信号処理装置、収音方法
US9918162B2 (en) 2011-12-08 2018-03-13 Sony Corporation Processing device and method for improving S/N ratio

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20030040610A (ko) * 2001-11-15 2003-05-23 한국전자통신연구원 골 전도 마이크로 입력된 음성신호의 음질 향상방법
US20130246059A1 (en) * 2010-11-24 2013-09-19 Koninklijke Philips Electronics N.V. System and method for producing an audio signal
JP2014502468A (ja) * 2010-11-24 2014-01-30 コーニンクレッカ フィリップス エヌ ヴェ オーディオ信号生成システム及び方法
US9812147B2 (en) 2010-11-24 2017-11-07 Koninklijke Philips N.V. System and method for generating an audio signal representing the speech of a user
US9918162B2 (en) 2011-12-08 2018-03-13 Sony Corporation Processing device and method for improving S/N ratio
US11070910B2 (en) 2011-12-08 2021-07-20 Sony Corporation Processing device and a processing method for voice communication
US11765497B2 (en) 2011-12-08 2023-09-19 Sony Group Corporation Earhole-wearable sound collection device, signal processing device, and sound collection method
JP2014096732A (ja) * 2012-11-09 2014-05-22 Oki Electric Ind Co Ltd 収音装置及び電話機
JP2017028718A (ja) * 2016-09-14 2017-02-02 ソニー株式会社 耳孔装着型収音装置、信号処理装置、収音方法

Similar Documents

Publication Publication Date Title
EP0763813B1 (en) Speech signal processing apparatus for detecting a speech signal from a noisy speech signal
US5228087A (en) Speech recognition apparatus and methods
WO2007080764A1 (ja) 対象音分析装置、対象音分析方法および対象音分析プログラム
US7917359B2 (en) Noise suppressor for removing irregular noise
JPH0431898A (ja) 音声雑音分離装置
JPH05333899A (ja) 音声入力装置、音声認識装置および警報発生装置
JPH04505372A (ja) 波形の分析
Kulkarni et al. A review of speech signal enhancement techniques
GB2230370A (en) Speech recognition
de-La-Calle-Silos et al. Synchrony-based feature extraction for robust automatic speech recognition
EP3696815B1 (en) Nonlinear noise reduction system
JP2014157023A (ja) 侵入物体検知装置
JPH02232697A (ja) 音声認識装置
JPH0449952B2 (ja)
EP3926983A3 (de) Hörsystem mit mindestens einem am kopf des nutzers getragenen hörinstrument sowie verfahren zum betrieb eines solchen hörsystems
JPH04227338A (ja) 音声信号処理装置
EP0100773B1 (en) Speech recognition system for an automotive vehicle
JPH07101853B2 (ja) 雑音低減方法
KR20000032269A (ko) 음향 기기의 음성인식장치
KR100434723B1 (ko) 음성 신호특성을 이용한 돌발잡음 제거장치 및 그 방법
JP2004064584A (ja) 信号分離抽出装置
EP1652171B1 (en) Method for analysing signals containing pulses
Dendukuri et al. Statistical feature set calculation using Teager energy operator on emotional speech signals
JPH04163497A (ja) 音声区間検出方法
JPH0293697A (ja) 雑音除去方法

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 19990803