JPH0720892A - 音声認識装置におけるノイズキャンセリング装置 - Google Patents

音声認識装置におけるノイズキャンセリング装置

Info

Publication number
JPH0720892A
JPH0720892A JP5160843A JP16084393A JPH0720892A JP H0720892 A JPH0720892 A JP H0720892A JP 5160843 A JP5160843 A JP 5160843A JP 16084393 A JP16084393 A JP 16084393A JP H0720892 A JPH0720892 A JP H0720892A
Authority
JP
Japan
Prior art keywords
unit
low frequency
frequency component
ratio
voice recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP5160843A
Other languages
English (en)
Inventor
Kazuo Takeshima
和男 武島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP5160843A priority Critical patent/JPH0720892A/ja
Publication of JPH0720892A publication Critical patent/JPH0720892A/ja
Withdrawn legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 本発明は、音声認識装置におけるノイズキャ
ンセリング装置に関し、騒音による音声認識性能の低下
を防止することを目的とする。 【構成】 音をアナログ電気信号に変換するマイク1
と、前記アナログ電気信号を周波数成分毎のデジタルデ
ータに変換する標本化部2と、前記標本化部2の出力か
ら音声らしい部分を検出して、出力する検出部3と、前
記検出部3の出力を受け取る判定部7と、この判定部7
で判定された音声信号と認識辞書5の登録パターンのパ
ターンマッチングを行う照合部4を設けた音声認識装置
において、前記判定部7は、入力された信号の低周波数
成分が、ある範囲に収まらない時、入力された信号を照
合部4へ送らないように構成した。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、音声認識装置におい
て、入力された音の低周波数成分を利用して、入力され
た音が音声かノイズかを判定するノイズキャンセリング
装置に関する。
【0002】
【従来の技術】図4は従来例の説明図、図5は従来例の
標本化部の波形説明図、図6は従来例の検出部の波形説
明図である。図4中1はマイク、2は標本化部、3は検
出部、4は照合部、5は認識辞書、6は制御部、(a)
〜(f)は処理の流れを示す。図5、図6中jはフレー
ム、iはチャンネル(ch)、Fijはjフレームのiチ
ャンネルのサンプリングデータ、Pj は信号の強さ、T
p は音声のパワー閾値、Lは連続してパワーPj ≧T
p を満たすフレーム数、Lmin は音声の最小フレーム
数を示す。
【0003】図4に基づいて従来例を説明する。まずマ
イク1では、音をアナログ電気信号に変換して標本化部
2に送る。標本化部2では、アナログ電気信号を一定時
間毎にサンプリングして周波数成分毎のデジタルデータ
に変換して検出部3に送る。
【0004】次に、検出部3では、一定の閾値以上の値
のサンプリングしたパワーが一定時間以上継続したか否
かで、入力された音の中から音声らしい部分を検出して
照合部4へ送る。
【0005】照合部4では、制御部6の指示に従い入力
パターンと認識辞書5中に登録されている登録パターン
のパターンマッチングを行い、照合結果の出力を得る。
以下図4〜図6により従来例を図4に示す処理の流れ
(a)〜(f)に従って説明する。
【0006】(a)マイク1では、音をアナログ電気信
号に変換して標本化部2に送る。 (b)標本化部2では、アナログ電気信号(図5A参
照)を10ミリセカンド毎にサンプリングする。そし
て、このサンプリング毎に16チャンネルの周波数成分
のデジタルデータに変換(図5B参照)して検出部3に
送る。
【0007】なお、図5Bでは、j番目のサンプリング
データをjフレームと呼び、jフレームのiチャンネル
のデータをFijで示している。 (c)検出部3では、デジタルデータFij中から下記の
条件を満たす部分を音声らしい部分として検出して照合
部4へ送る。(以下、音声らしい部分を入力パターンと
呼ぶ)(図6B、図6A参照) L≧Lmin 但し、上記のパラメータは下記のとおりである。
【0008】L:連続してパワー
【0009】
【数1】
【0010】を満たすフレームの数を示す Lmin :音声の最小フレーム数 THp :音声のパワー閾値 (d)制御部6では、照合部4にマッチングさせる登録
パターンの情報を与える。
【0011】(e)照合部4では、制御部6の指示に従
い検出された入力パターンと認識辞書5に格納された登
録パターンのパターンマッチングを行い、照合結果を制
御部6に送る。
【0012】(f)制御部6では、認識結果を出力す
る。
【0013】
【発明が解決しようとする課題】上記のような従来のも
のにおいては、検出部3から送られてくる入力パターン
はパワーとフレーム数だけで検出している。
【0014】従って、例えば物が落ちた音、ハンマーで
物を打った音等の騒音が入力されても入力パターンを検
出して、誤った認識結果を出力している。このため、騒
音のある環境では、騒音による認識性能の低下が問題と
なっていた。
【0015】したがって、本発明の目的は、騒音のある
環境でも、騒音による音声認識性能の低下を防止できる
ようにした音声認識装置におけるノイズキャンセリング
装置を提供することである。
【0016】
【課題を解決するための手段】図1は本発明の原理説明
図であり、図1中、図4と同じものは、同一符号で示し
てある。また、7は判定部、(g)は処理の流れを示
す。
【0017】本発明は、上記目的を達成するため、次の
ように構成した。 (1)音をアナログ電気信号に変換するマイク1と、前
記アナログ電気信号を周波数成分毎のデジタルデータに
変換する標本化部2と、前記標本化部2から送られてき
た出力により、一定の閾値以上の値のパワーが一定時間
以上継続したか否かで、入力された音から、音声らしい
部分を検出して、出力する検出部3と、前記検出部3の
出力を受け取る判定部7と、この判定部7で判定された
音声信号と認識辞書5に格納された登録パターンのパタ
ーンマッチングを行う照合部4とを設けた音声認識装置
において、前記判定部7は、入力された信号の全区間に
渡る低周波数成分がある範囲に収まらない時、入力され
た信号を照合部4へ送らないように構成した。
【0018】
【作用】上記構成に基づく本発明の作用を、図1に基づ
いて説明する。人の音声には、母音があるため、ある範
囲の低周波数成分が必ず含まれている。
【0019】従って、判定部7では、検出部3で検出さ
れた音声らしい部分の信号の全区間において、低周波数
成分がある範囲に収まるかどうかを判定する。前記低周
波数成分がある範囲に収まる時は、前記信号を音声信号
として照合部4へ送る。
【0020】前記低周波数成分がある範囲に収まらない
時は、前記信号をノイズと判定して照合部4へは送らな
いようにした。以上のように、本発明は、騒音による音
声認識性能の低下を防止することができる。
【0021】
【実施例】以下、本発明の実施例を図面に基づいて説明
する。図2、図3は、本発明の実施例を示した図であ
り、図2、図3中、図1、図4〜図6と同じものは、同
一符号で示してある。また8は演算部、9は範囲設定
部、ιは部分区間、sは部分区間の始端のフレーム、e
は部分区間の終端のフレームを示す。
【0022】本発明は、入力された音の低周波成分を利
用して、入力された音が音声かノイズかを判定する判定
部7を設けたものである。そして、判定部7は演算部8
と、上限閾値と下限閾値の間のある範囲を設定する範囲
設定部9よりなる。
【0023】なお、本発明と、図4における従来例に判
定部7を付け加えたものであり、判定部7以外の処理は
従来のものと同じである。以下、判定部7の構成及び動
作に関する第1〜12実施例につき説明する。
【0024】(第1実施例の説明)検出部3から送られ
てくる入力パターンが判定部7に入力される(c)。判
定部7には、演算部8と範囲設定部9が設けられてい
る。
【0025】演算部8では、各フレームの周波数分布
(図5B参照)から、低周波数成分の量を検出する。次
に、この検出した量を各フレーム毎に求めてその量の平
均を求める演算をする。
【0026】範囲設定部9では、上記量の平均が、上限
閾値と下限閾値の範囲内でない時、、音声でないと判定
して、前記入力パターンを照合部4へ送らないようにし
た。第1実施例の判定部7を条件式を用いて説明する
と、次のとおりである。
【0027】
【数2】
【0028】但し上記式2のパラメータの意味は、次の
とおりである。 n:低周波数成分(以下、低域成分という)の範囲 THh1 :低域成分の平均値の上限閾値 TH11 :低域成分の平均値の下限閾値 L:検出部3から送られてくる連続したフレームの数
(連続して式1を満たすフレームの数) i:周波数分布のi番目のチャンネル(ch) j:jフレームのことであり、j番目のサンプリングデ
ータを示す Fij:jフレームのiチャンネルのデータ 判定部7は、上記式2の条件式に従い入力パターンを判
定して、式2の条件式を満足する入力パターンだけを照
合部4に送るようにした。
【0029】(第2実施例の説明)検出部3から送られ
てくる入力パターンが判定部7に入力される。判定部7
には、演算部8と範囲設定部9が設けられている。
【0030】演算部8では、各フレーム毎に周波数分布
(図5B参照)から、低周波数成分の量を検出する。こ
の検出した量を各フレーム毎の全体の量で割算して、低
周波数成分の割合を求める。次に、これらの割合の平均
を求める演算をする。
【0031】範囲設定部9では、この割合の平均が、上
限閾値と下限閾値の範囲内でない時、音声でないと判定
して、前記入力パターンを照合部4へ送らないようにし
た。第2実施例の判定部7を条件式を用いて説明する
と、次のとおりである。
【0032】
【数3】
【0033】但し、上記式3のパラメータの意味は次の
とおりである。 n:低域成分(低周波数成分)の範囲 THh1 :低域成分の割合の平均値の上限閾値 TH11 :低域成分の割合の平均値の下限閾値 L:検出部3から送られてくる連続したフレームの数 Fij:jフレームのiチャンネルのデータ Pj :jフレームの全体の量 判定部7は上記式3の条件式に従い入力パターンを判定
して、式3の条件式を満足する入力パターンだけを照合
部4に送るようにした。
【0034】(第3実施例の説明)検出部3から送られ
てくる入力パターンが判定部7に入力される。判定部7
には、演算部8と範囲設定部9が設けられている。
【0035】演算部8では、各フレームの周波数分布
(図5B参照)から、各フレーム毎の低周波数成分の量
を検出する。次に、この低周波数成分の量がある範囲
(上限閾値と下限閾値により設定する)に収まるフレー
ムの数を求める。次いで、この低周波数成分の量がある
範囲に収まるフレームの数を全フレーム数で割算して、
低周波数成分の量がある範囲に収まるフレームの数の割
合を求める演算をする。
【0036】範囲設定部9では、この割合が、上限閾値
と下限閾値の範囲内でない時、音声でないと判定して、
前記入力パターンを照合部4へ送らないようにした。第
3実施例の判定部7を条件式を用いて説明すると、次の
とおりである。
【0037】THh2 ≧L′/L≧TH12 但し、L′は下記式4を満たすフレームの数を示す。
【0038】
【数4】
【0039】上記条件式及び式4のパラメータの意味は
次のとおりである。 THh1 :低域成分(低周波数成分)の上限閾値 TH11 :低域成分の下限閾値 THh2 :低域成分がTH11 以上THh1 以下の条件
を満たすフレームの割合の上限閾値 TH12 :低域成分がTH11 以上THh1 以下の条件
を満たすフレームの割合の下限閾値 判定部7は、上記条件式(THh2 ≧L′/L≧TH1
2 )に従い入力パターンを判定して、上記条件式を満足
する入力パターンだけを照合部4に送るようにした。
【0040】(第4実施例の説明)検出部3から送られ
てくるパターンが判定部7に入力される。判定部7に
は、演算部8と範囲設定部9が設けられている。
【0041】演算部8では、各フレームの周波数分布
(図5B参照)から、各フレーム毎の低周波数成分の量
を検出する。この検出した量を各フレーム毎の全体の量
で割算して、低周波数成分の割合を求める。次に、この
低周波数成分の割合がある範囲(上限閾値と下限閾値に
より設定する)に収まるフレームの数を求める。次い
で、この低周波数成分の割合がある範囲に収まるフレー
ムの数を全フレーム数で割算して、低周波数成分の割合
がある範囲に収まるフレームの数の割合を求める演算を
する。
【0042】範囲設定部9では、この割合が、上限閾値
と下限閾値の範囲内でない時、音声でないと判定して、
前記入力パターンを照合部4へ送らないようにした。第
4実施例の判定部7を条件式を用いて説明すると次のと
おりである。
【0043】THh2 ≧L′/L≧TH12 但し、L′は下記式5を満たすフレームの数を示す。
【0044】
【数5】
【0045】上記条件式及び式5のパラメータの意味は
次のとおりである。 THh1 :低域成分(低周波数成分)の割合の上限閾値 TH11 :低域成分の割合の下限閾値 THh2 :低域成分がTH11 以上THh1 以下の条件
を満たすフレームの割合の上限閾値 TH12 :低域成分がTH11 以上THh1 以下の条件
を満たすフレームの割合の下限閾値 判定部7は上記条件式(THh2 ≧L′/L≧TH
2 )に従い入力パターンを判定して、上記条件式を満
足する入力パターンだけを照合部4に送るようにした。
【0046】(第5実施例の説明)検出部3から送られ
てくる入力パターンが判定部7に入力される(c)。判
定部7には、演算部8と範囲設定部9が設けられてい
る。
【0047】演算部8では、入力パターンについて、パ
ワーが最大のフレームの前後ι/2フレームの部分区間
を求める(図3参照)。この部分区間の各フレームの周
波数分布から、低周波数成分の量を検出する。次に、こ
の検出した量を部分区間の各フレーム毎に求めてその量
の平均を求める演算をする。
【0048】範囲設定部9では、上記量の平均が上限閾
値と下限閾値の範囲内でない時、音声でないと判定し
て、前記入力パターンを照合部4へ送らないようにし
た。第5実施例の判定部を条件式を用いて説明すると、
次のとおりである。
【0049】
【数6】
【0050】但し、上記式6のパラメータは、次のとお
りである。 ι:部分区間の長さ s:部分区間の始端のフレーム e:部分区間の終端のフレーム THh1 :部分区間における低域成分(低周波数成分)
の平均値の上限閾値 TH11 :部分区間における低域成分の平均値の下限閾
値 判定部7は、上記式6の条件式に従い入力パターンを判
定して、数2の条件式を満足する入力パターンだけを照
合部4に送るようにした。
【0051】(第6実施例の説明)検出部3から送られ
てくる入力パターンが判定部7に入力される。判定部7
には、演算部8と範囲設定部9が設けられている。
【0052】演算部8では、入力パターンについて、パ
ワーが最大のフレームの前後ι/2フレームの部分区間
を求める(図3参照)。この部分区間の各フレームの周
波数分布から、低周波数成分の量を検出する。この検出
した量を、部分区間の各フレーム毎の全体の量で割算し
て、低周波数成分の割合を求める。次に、これらの割合
の平均を求める演算をする。
【0053】範囲設定部9では、この割合の平均が、上
限閾値と下限閾値の範囲内でない時、音声でないと判定
して、前記入力パターンを照合部4へ送らないようにし
た。第6実施例の判定部7を条件式を用いて説明する
と、次のとおりである。
【0054】
【数7】
【0055】但し、上記式7のパラメータの意味は次の
とおりである。 THh1 :部分区間における低域成分(低周波数成分)
の割合の平均値の上限閾値 TH11 :部分区間における低域成分の割合の平均値の
下限閾値 判定部7は、上記式7の条件式に従い入力パターンを判
定して、式7の条件式を満足する入力パターンだけを照
合部4に送るようにした。
【0056】(第7実施例の説明)検出部3から送られ
てくる入力パターンが判定部7に入力される。判定部7
には、演算部8と範囲設定部9が設けられている。
【0057】演算部8では、入力パターンについて、パ
ワーが最大のフレームの前後ι/2フレームの部分区間
を求める(図3参照)。この部分区間の各フレームの周
波数分布から、部分区間の各フレーム毎の低周波数成分
の量を検出する。次に、この低周波数成分の量がある範
囲(上限閾値と下限閾値により設定する)に収まるフレ
ームの数を求める。次いで、この低周波数成分の量があ
る範囲に収まるフレームの数を部分区間の全フレーム数
で割算して、低周波数成分の量がある範囲に収まるフレ
ームの数の割合を求める演算をする。
【0058】範囲設定部9では、この割合が、上限閾値
と下限閾値の範囲内でない時、音声でないと判定して、
前記入力パターンを照合部4へ送らないようにした。第
7実施例の判定部7を条件式を用いて説明すると、次の
とおりである。
【0059】THh2 ≧ι′/ι≧TH12 但し、ι′は、部分区間における、低周波数成分の量が
ある範囲に収まるフレームの数である。(図3で説明す
るとι′は、フレームs〜eの内、式4を満たすフレー
ムの数である) 上記条件式のパラメータは次のとおりである。
【0060】THh2 :部分区間における低域成分がT
H11 (低域成分の下限閾値)以上でTHh1 (低域成
分の上限閾値)以下の条件を満たすフレームの割合の上
限閾値 TH12 :部分区間における低域成分がTH11 以上T
Hh1 以下の条件を満たすフレームの割合の下限閾値 判定部7は、上記条件式に従い入力パターンを判定し
て、上記条件式を満足する入力パターンだけを照合部4
に送るようにした。
【0061】(第8実施例の説明)検出部3から送られ
てくる入力パターンが判定部7に入力される。判定部7
には、演算部8と範囲設定部9が設けられている。
【0062】演算部8では、入力パターンについて、パ
ワーが最大のフレームの前後ι/2フレームの部分区間
を求める(図3参照)。この部分区間の各フレームの周
波数分布から、部分区間の各フレーム毎の低周波数成分
の量を検出する。この検出した量を各フレーム毎の全体
の量で割算して、低周波数成分の割合を求める。
【0063】次に、この低周波数成分の割合がある範囲
(上限閾値と下限閾値により設定する)に収まるフレー
ムの数を求める。次いで、この低周波数成分の割合があ
る範囲に収まるフレームの数を部分区間の全フレーム数
で割算して、低周波数成分の割合がある範囲に収まるフ
レームの数の割合を求める演算をする。
【0064】第8実施例の判定部7を条件式を用いて説
明すると、次のとおりである。 THh2 ≧ι′/ι≧TH12 但し、ι′は、部分区間における低周波数成分の割合が
ある範囲に収まるフレームの数である。(図3で説明す
ると、ι′は、フレームs〜eの内、式5を満たすフレ
ームの数である) 上記条件式のパラメータは次のとおりである。
【0065】THh2 :部分区間における低域成分がT
H11 (低域成分の割合の下限閾値)以上THh1 (低
域成分の割合の下限閾値)以下の条件を満たすフレーム
の割合の上限閾値 TH12 :部分区間における低域成分がTH11 以上T
Hh1 以下の条件を満たすフレームの割合の下限閾値 判定部7は、上記条件式に従い入力パターンを判定し
て、上記条件式を満足する入力パターンだけを照合部4
に送るようにした。
【0066】(第9実施例の説明)検出部3から送られ
てくる入力パターンが判定部7に入力される。判定部7
には、演算部8と範囲設定部9が設けられている。
【0067】演算部8では、入力パターンの各フレーム
の周波数分布から、低周波数成分の量を検出する。次
に、この低周波数成分の量がある範囲(上限閾値と下限
閾値により設定する)に収まる連続した部分区間のフレ
ームの数を求める。
【0068】範囲設定部9では、このフレームの数が、
上限閾値と下限閾値の範囲内でない時、音声でないと判
定して、前記入力パターンを照合部4へ送らないように
した。
【0069】第9実施例の判定部7を条件式を用いて説
明すると、次のとおりである。 THh3 ≧ιc≧TH13 但し、ιcは、全区間の内、連続して式4を満たすフレ
ームの数である。
【0070】上記条件式のパラメータの意味は次のとお
りである。 THh3 :低域成分がTH11 (低域成分の下限閾値)
以上THh1 (低域成分の上限閾値)以下の条件を満た
す連続したフレームの上限閾値 TH13 :低域成分がTH11 以上THh1 以下の条件
を満たす連続したフレームの下限閾値 判定部7は、上記条件式に従い入力パターンを判定し
て、上記条件式を満足する入力パターンだけを照合部4
に送るようにした。
【0071】(第10実施例の説明)検出部3から送ら
れてくる入力パターンが判定部7に入力される。判定部
7には、演算部8と範囲設定部9が設けられている。
【0072】演算部8では、入力パターンの各フレーム
の周波数分布から、低周波数成分の量を検出する。この
検出した量を各フレーム毎の全体の量で割算して、低周
波数成分の割合を求める。次に、この低周波数成分の割
合がある範囲(上限閾値と下限閾値により設定する)に
収まる連続した部分区間のフレームの数を求める。
【0073】範囲設定部9では、このフレームの数が、
上限閾値と下限閾値の範囲内でない時、音声でないと判
定して、前記入力パターンを照合部4へ送らないように
した。
【0074】第10実施例の判定部7を条件式を用いて
説明すると、次のとおりである。 THh3 ≧ιc≧TH13 但し、ιcは、全区間の内、連続して式5を満たすフレ
ームの数である。
【0075】上記条件式のパラメータの意味は次のとお
りである。 THh3 :低域成分がTH11 (低域成分の割合の下限
閾値)以上THh1 (低域成分の割合の上限閾値)以下
の条件を満たす連続したフレームの上限閾値 TH13 :低域成分がTH11 以上THh1 以下の条件
を満たす連続したフレームの下限閾値 判定部7は、上記条件式に従い入力パターンを判定し
て、上記条件式を満足する入力パターンだけを照合部4
に送るようにした。
【0076】(第11実施例の説明)検出部3から送ら
れてくる入力パターンが判定部7に入力される。判定部
7には、演算部8と範囲設定部9が設けられている。
【0077】演算部8では、入力パターンの各フレーム
の周波数分布から、低周波数成分の量を検出する。次
に、この低周波数成分の量がある範囲(上限閾値と下限
閾値により設定する)に収まる連続した部分区間のフレ
ームの数を求める。次いで、この連続した部分区間のフ
レームの数を全区間のフレームの数で割算して、この連
続した部分区間の割合を求める演算をする。
【0078】範囲設定部9では、この連続した部分区間
の割合が、上限閾値と下限閾値の範囲内でない時、音声
でないと判定して、前記入力パターンを照合部4へ送ら
ないようにした。
【0079】第11実施例の判定部7を条件式を用いて
説明すると、次のとおりである。 THh4 ≧ιc/L≧TH14 但し、ιcは、全区間の内、連続して式4を満たすフレ
ームの数を示す。
【0080】上記条件式のパラメータの意味は次のとお
りである。 THh4 :低域成分がTH11 (低域成分の下限閾値)
以上THh1 (低域成分の上限閾値)以下の条件を満た
す連続したフレームの割合の上限閾値 TH14 :低域成分がTH11 以上THh1 以下の条件
を満たす連続したフレームの割合の下限閾値 判定部7は、上記条件式に従い入力パターンを判定し
て、上記条件式を満足する入力パターンだけを照合部4
に送るようにした。
【0081】(第12実施例の説明)検出部3から送ら
れてくる入力パターンが判定部7に入力される。判定部
7には、演算部8と範囲設定部9が設けられている。
【0082】演算部8では、入力パターンの各フレーム
の周波数分布から、低周波数成分の量を検出する。この
検出した量を各フレーム毎の全体の量で割算して、低周
波数成分の割合を求める。次に、この低周波数成分の割
合がある範囲(上限閾値と下限閾値により設定する)に
収まる連続した部分区間のフレームの数を求める。次い
で、この連続した部分区間のフレームの数を全区間のフ
レームの数で割算して、この連続した部分区間の割合を
求める演算をする。
【0083】範囲設定部9では、この連続した部分区間
の割合が上限閾値と下限閾値の範囲内でない時、音声で
ないと判定して、前記入力パターンを照合部4へ送らな
いようにした。
【0084】第12実施例の判定部7を条件式を用いて
説明すると、次のとおりである。 THh4 ≧ιc/L≧TH14 但し、ιcは、全区間の内、連続して式5を満たすフレ
ームの数を示す。
【0085】上記条件式のパラメータの意味は次のとお
りである。 THh4 :低域成分がTH11 (低域成分の割合の下限
閾値)以上THh1 (低域成分の割合の上限閾値)以下
の条件を満たす連続したフレームの割合の上限閾値 TH14 :低域成分がTH11 以上THh1 以下の条件
を満たす連続したフレームの割合の下限閾値 判定部7は、上記条件式に従い入力パターンを判定し
て、上記条件式を満足する入力パターンだけを照合部4
に送るようにした。
【0086】(他の実施例) 周波数成分のデジタルデータ(図5B参照)の1チャ
ンネルの周波数は400Hz、16チャンネルの周波数
は4600Hzとすることができる。
【0087】そして、チャンネル総数は16でなくても
よく、必要に応じ増減が可能である。また、チャンネル
間隔は、周波数に関して均一にする必要はなく、低周波
数部分で狭く高周波数部分で広くすることができる。
【0088】低周波数成分(1〜n)として、16チ
ャンネルの内1〜5チャンネルとすることができる。こ
れは、個人差または男女の差により適当に設定すること
ができる。
【0089】上限閾値と下限閾値は、騒音の種類等に
よる音声認識性能の低下が少なくなる値に設定される。
【0090】
【発明の効果】 騒音による誤った認識結果を出力することが少なくな
り、騒音による音声認識性能の低下を防止することがで
きる。
【0091】判定に部分区間を用いることにより、音
声認識性能の向上、判定処理時間の短縮が可能である。
【図面の簡単な説明】
【図1】本発明の原理説明図である。
【図2】判定部の説明図である。
【図3】部分区間の説明図である。
【図4】従来例の説明図である。
【図5】標本化部の波形説明図であり、図5Aはアナロ
グ電気信号を示す図であり、図5Bはjフレームの周波
数分布とFijを示す図である。
【図6】検出部の波形説明図であり、図6Aは入力され
た音のパワー波形を示す図であり、図6Bは入力パター
ンを示す図である。
【符号の説明】
1 マイク 2 標本化部 3 検出部 4 照合部 5 認識辞書 6 制御部 7 判定部 (a)〜(g) 処理の流れ

Claims (7)

    【特許請求の範囲】
  1. 【請求項1】 音をアナログ電気信号に変換するマイク
    (1)と、 前記アナログ電気信号を周波数成分毎のデジタルデータ
    に変換する標本化部(2)と、 前記標本化部(2)より入力された音から音声らしい部
    分を検出する検出部(3)と、 前記検出部(3)の出力を受け取り認識辞書(5)に格
    納された登録パターンのパターンマッチングを行う照合
    部(4)とを設けた音声認識装置において、 前記検出部(3)と照合部(4)との間に判定部(7)
    を設け、判定部(7)は前記検出部(3)から入力され
    た信号の全区間に渡る低周波数成分がある範囲に収まる
    時、前記検出部から入力された信号を照合部へ送ること
    を特徴とする音声認識装置におけるノイズキャンセリン
    グ装置。
  2. 【請求項2】 上記低周波数成分として、低周波数成分
    の量の平均、低周波数成分の割合の平均、低周波数成分
    の量がある範囲に収まる部分の割合、低周波数成分の割
    合がある範囲に収まる部分の割合のいずれかで判定する
    ことを特徴とする請求項1記載の音声認識装置における
    ノイズキャンセリング装置。
  3. 【請求項3】 音をアナログ電気信号に変換するマイク
    (1)と、 前記アナログ電気信号を周波数成分毎のデジタルデータ
    に変換する標本化部(2)と、 前記標本化部(2)より入力された音から音声らしい部
    分を検出する検出部(3)と、 前記検出部(3)の出力を受け取り認識辞書(5)に格
    納された登録パターンのパターンマッチングを行う照合
    部(4)とを設けた音声認識装置において、 前記検出部(3)と照合部(4)との間に判定部(7)
    を設け、判定部(7)は、前記検出部(3)から入力さ
    れた信号中の予め定めた部分区間について、低周波数成
    分がある範囲に収まる時、前記検出部(3)から入力さ
    れた信号を照合部(4)へ送ることを特徴とする音声認
    識装置におけるノイズキャンセリング装置。
  4. 【請求項4】 上記低周波数成分として、低周波数成分
    の量の平均、低周波数成分の割合の平均、低周波数成分
    の量がある範囲に収まる部分の割合、低周波数成分の割
    合がある範囲に収まる部分の割合のいずれかで判定する
    ことを特徴とする請求項3記載の音声認識装置における
    ノイズキャンセリング装置。
  5. 【請求項5】 音をアナログ電気信号に変換するマイク
    (1)と、 前記アナログ電気信号を周波数成分毎のデジタルデータ
    に変換する標本化部(2)と、 前記標本化部(2)より入力された音から音声らしい部
    分を検出する検出部(3)と、 前記検出部(3)の出力を受け取り認識辞書(5)に格
    納された登録パターンのパターンマッチングを行う照合
    部(4)とを設けた音声認識装置において、 前記検出部(3)と照合部(4)との間に判定部(7)
    を設け、判定部(7)は、前記検出部(3)から入力さ
    れた信号中の低周波数成分がある範囲に収まる連続した
    部分区間が、ある範囲に収まる時、前記検出部(3)か
    ら入力された信号を照合部(4)へ送ることを特徴とす
    る音声認識装置におけるノイズキャンセリング装置。
  6. 【請求項6】 上記低周波数成分がある範囲に収まる連
    続した部分区間として、部分区間の長さ又は部分区間の
    長さの、入力された信号の全区間の長さに占める割合で
    判定することを特徴とする請求項5記載の音声認識装置
    におけるノイズキャンセリング装置。
  7. 【請求項7】 上記低周波数成分として、低周波数成分
    の量又は低周波数成分の割合で判定することを特徴とす
    る請求項6記載の音声認識装置におけるノイズキャンセ
    リング装置。
JP5160843A 1993-06-30 1993-06-30 音声認識装置におけるノイズキャンセリング装置 Withdrawn JPH0720892A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5160843A JPH0720892A (ja) 1993-06-30 1993-06-30 音声認識装置におけるノイズキャンセリング装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5160843A JPH0720892A (ja) 1993-06-30 1993-06-30 音声認識装置におけるノイズキャンセリング装置

Publications (1)

Publication Number Publication Date
JPH0720892A true JPH0720892A (ja) 1995-01-24

Family

ID=15723614

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5160843A Withdrawn JPH0720892A (ja) 1993-06-30 1993-06-30 音声認識装置におけるノイズキャンセリング装置

Country Status (1)

Country Link
JP (1) JPH0720892A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018197855A (ja) * 2017-05-24 2018-12-13 ハーマン インターナショナル インダストリーズ インコーポレイテッド 複数の音声認識装置間の調整
JP2020129080A (ja) * 2019-02-08 2020-08-27 三浦 浩之 音声認識システム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018197855A (ja) * 2017-05-24 2018-12-13 ハーマン インターナショナル インダストリーズ インコーポレイテッド 複数の音声認識装置間の調整
JP2020129080A (ja) * 2019-02-08 2020-08-27 三浦 浩之 音声認識システム

Similar Documents

Publication Publication Date Title
EP0637012B1 (en) Signal processing device
KR101122838B1 (ko) 음원 신호 분리 장치 및 방법, 및 피치 검출 장치 및 방법
US4461024A (en) Input device for computer speech recognition system
WO1993017415A1 (en) Method for determining boundaries of isolated words
US5204906A (en) Voice signal processing device
WO2001029821A1 (en) Method for utilizing validity constraints in a speech endpoint detector
US9245537B2 (en) Speech enhancement apparatus and method for emphasizing consonant portion to improve articulation of audio signal
JPH0720892A (ja) 音声認識装置におけるノイズキャンセリング装置
EP1229517B1 (en) Method for recognizing speech with noise-dependent variance normalization
CN113611330B (zh) 一种音频检测方法、装置、电子设备及存储介质
JP2010026323A (ja) 話速検出装置
JP2001166783A (ja) 音声区間検出方法
JP3594356B2 (ja) 音声処理装置
Chelloug et al. Robust Voice Activity Detection Against Non Homogeneous Noisy Environments
KR101251045B1 (ko) 오디오 판별 장치 및 그 방법
KR100345402B1 (ko) 피치 정보를 이용한 실시간 음성 검출 장치 및 그 방법
JPH05108089A (ja) 音声区間検出方法
KR950013555B1 (ko) 음성신호처리장치
JP2018036442A (ja) 音声処理プログラム、音声処理方法及び音声処理装置
TW202226226A (zh) 具低複雜度語音活動檢測演算之設備及方法
JPH07225592A (ja) 有音区間検出装置
JP2643202B2 (ja) 入力音声の定常部、過渡部、不確定部の検出装置
JPH11224097A (ja) 音声の有音/休止判定方法およびその装置
JP2000352987A (ja) 音声認識装置
JPH02289899A (ja) 音声検出方式

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20000905