JP2989219B2 - 音声区間検出方式 - Google Patents
音声区間検出方式Info
- Publication number
- JP2989219B2 JP2989219B2 JP2128872A JP12887290A JP2989219B2 JP 2989219 B2 JP2989219 B2 JP 2989219B2 JP 2128872 A JP2128872 A JP 2128872A JP 12887290 A JP12887290 A JP 12887290A JP 2989219 B2 JP2989219 B2 JP 2989219B2
- Authority
- JP
- Japan
- Prior art keywords
- voice
- band
- section
- noise
- power
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Description
下、特に、自動車の中、工場の中等の騒音の中での音声
認識に用いて好適な音声区間検出方式に関する。
に重要な問題であり、以後の認識結果に大きな影響を及
ぼす。音声区間検出の一般的なものには、新見著「音声
認識」(共立出版)のp.68〜69に記載の二つの閾値を用
いる方法があるが、この方法では、周囲にノイズが存在
するような場合、音声区間を誤って検出してしまい、ノ
イズを音声であると誤認識してしまうことがある。この
対策として、例えば、特開昭60−216400号公報に記載さ
れているように、周囲のノイズの大きさによって閾値を
変化させる方法があるが、ノイズはある帯域に偏って存
在することが多く、ある帯域の成分だけで前記の閾値を
超えてしまうという欠点がある。
で、特に、周波数帯域の低い部分にノイズの大半が集中
する車の中などのように、ある帯域にノイズが偏って存
在する状態でも、正しい音声区間を検出することのでき
る音声区間検出方式を提供することを目的としてなされ
たものである。
換し、変換された入力信号をもとに音声の存在する区間
を検出する音声区間検出方式において、前記入力信号を
一つ以上の周波数帯域に分割し、各帯域のパワーを求め
る手段と、前記入力信号のうち、音声が存在しない区間
から周囲の雑音の各帯域のパワーN(w)を推定して保
持する手段と、該手段によって得られた雑音の各帯域パ
ワーN(w)が小さい帯域を強調するようなプリエンフ
ァシスとを有し、入力信号に前記プリエンファシスをか
けた信号を用いて、区間検出をすることを特徴としたも
のである。
記の雑音の各帯域パワーN(w)が、予め決められてい
た最小値m以下になったとき、N(w)=mとすること
を特徴としたものである。以下、本発明の実施例に基い
て説明する。
を説明するためのプロック線図、第2図は、その動作を
説明するためのフローチャートで、第1図中、1は音声
入力部、2は帯域パワー検出部、3は雑音推定部、4は
プリエンファシス、5は音声区間検出部、6は音声認識
部である。なお、ここで用いるパワーとは、各帯域スペ
クトラムの値、或いは、その自乗値である。
気信号変換器を用いて、音を電気信号x(t)に変換す
る。
信号x(t)をバンドパスフィルタ群のような帯域分割
装置を用いて、n個の帯域に分割してから、各帯域パワ
ーX(t,w)を検出する。(w=1,2,…,n) 雑音推定部3は、音声が存在しない区間において、帯
域パワー検出部2から得られた各帯域のパワーX(t,
w)の200msec程度の間の平均値を求め、これを雑音の各
帯域のパワーN(w)と推定し、再度この値が更新され
るまで保持しておく。
音の帯域パワーN(w)が他の帯域パワーと比較して小
さい場合、その帯域を強調するもので、例えば、 として、y(t)をプリエンファシスの出力とするが、
他のプリエンファシスを用いても実現可能である。
及び、y(t)が非常に大きくなってしまい、区間検出
できなくなる恐れがあるので、その対策として、第3図
に示すように、予め、N(w)の最小値mを求めてお
き、雑音の各帯域パワーN(w)が、この予め決められ
ていた最小値m以下になったとき、つまり、N(w)<
mのとき、 N(w)=m とするとよい。
y(t)を用いて、区間検出を行う。区間検出の方法と
しては、第4図に示すような、2つの閾値を使う方法が
ある。この方法は予め閾値T1,T2(T2>T1)を決めてお
き、プリエンファシス4の出力信号y(t)のパワーが
T1を超えた時点t1から、次にT1以下による時点t2までの
区間Sを検出し、この区間内に第二の閾値T2を超える部
分がある時に限り、この区間Sを音声区間として検出す
る方法であるが、他の公知の方法を用いても実現可能で
ある。
出部5で区間検出された信号のみを用いて、音声認識を
するものであり、例えば、「2値のTSPを用いた単語音
声認識システムの開発」(安田晴剛他、電気学会論文誌
C108巻、昭和63年10月号p.858〜865)記載の音声認識シ
ステムを用いるが、他の公知の音声認識システムを用い
ても実現可能である。
する車の中などのように、ある帯域にノイズが偏ってい
る場合、従来の方法では、ある帯域の成分による影響だ
けで音声区間を誤検出することがあったが、本発明の区
間検出方式では、入力信号にノイズの小さな帯域を強調
するようなプリエンファシスをかけた信号を用いて、区
間検出を行っているので、従来の方法よりも誤検出する
可能が少なくなる。
方式を音声認識装置に用いることにより、ノイズの大半
が低減に存在する車の中などのように、ある帯域にノイ
ズが偏っている場合でも、誤認識する可能性が少ない音
声認識装置が実現する。
ロック線図、第2図及び第3図は、それぞれ本発明の実
施例を説明するためのフローチャート、第4図は、音声
区間検出の一例を説明するためのタイムチャートであ
る。 1……音声入力部、2……帯域パワー検出部、3……雑
音推定部、4……プリエンファシス、5……音声区間検
出部、6……音声認識部。
Claims (2)
- 【請求項1】音声を集音して電気信号に変換し、変換さ
れた入力信号をもとに音声の存在する区間を検出する音
声区間検出方式において、前記入力信号を一つ以上の周
波数帯域に分割し、各帯域のパワーを求める手段と、前
記入力信号のうち、音声が存在しない区間から周囲の雑
音の各帯域のパワーN(w)を推定して保持する手段
と、該手段によって得られた雑音の各帯域パワーN
(w)が小さい帯域を強調するようなプリエンファシス
とを有し、入力信号に前記プリエンファシスをかけた信
号を用いて、区間検出をすることを特徴とした音声区間
検出方式。 - 【請求項2】前記の雑音の各帯域パワーN(w)が、予
め決められていた最小値m以下になったとき、N(w)
=mとすることを特徴とする請求項1記載の音声区間検
出方式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2128872A JP2989219B2 (ja) | 1990-05-18 | 1990-05-18 | 音声区間検出方式 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2128872A JP2989219B2 (ja) | 1990-05-18 | 1990-05-18 | 音声区間検出方式 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH0424693A JPH0424693A (ja) | 1992-01-28 |
JP2989219B2 true JP2989219B2 (ja) | 1999-12-13 |
Family
ID=14995450
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2128872A Expired - Lifetime JP2989219B2 (ja) | 1990-05-18 | 1990-05-18 | 音声区間検出方式 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2989219B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014051135A2 (en) | 2012-09-25 | 2014-04-03 | Kabushiki Kaisha Toshiba | Handwritten document processing apparatus and method |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100785471B1 (ko) | 2006-01-06 | 2007-12-13 | 와이더댄 주식회사 | 통신망을 통해 가입자 단말기로 전송되는 오디오 신호의출력 품질 개선을 위한 오디오 신호의 처리 방법 및 상기방법을 채용한 오디오 신호 처리 장치 |
JP5732976B2 (ja) * | 2011-03-31 | 2015-06-10 | 沖電気工業株式会社 | 音声区間判定装置、音声区間判定方法、及びプログラム |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2797616B2 (ja) | 1990-03-16 | 1998-09-17 | 松下電器産業株式会社 | 雑音抑圧装置 |
-
1990
- 1990-05-18 JP JP2128872A patent/JP2989219B2/ja not_active Expired - Lifetime
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2797616B2 (ja) | 1990-03-16 | 1998-09-17 | 松下電器産業株式会社 | 雑音抑圧装置 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014051135A2 (en) | 2012-09-25 | 2014-04-03 | Kabushiki Kaisha Toshiba | Handwritten document processing apparatus and method |
Also Published As
Publication number | Publication date |
---|---|
JPH0424693A (ja) | 1992-01-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP1065657B1 (en) | Method for detecting a noise domain | |
US8065115B2 (en) | Method and system for identifying audible noise as wind noise in a hearing aid apparatus | |
JP2776848B2 (ja) | 雑音除去方法、それに用いるニューラルネットワークの学習方法 | |
EP0727769B1 (en) | Method of and apparatus for noise reduction | |
JPS58184200A (ja) | 対話了解度を強調する装置およびその方法 | |
EP3229487B1 (en) | Approach for detecting alert signals in changing environments | |
JP2989219B2 (ja) | 音声区間検出方式 | |
US5732141A (en) | Detecting voice activity | |
JPH06208395A (ja) | ホルマント検出装置及び音声加工装置 | |
JP2563719B2 (ja) | 音声加工装置と補聴器 | |
JP2992324B2 (ja) | 音声区間検出方法 | |
US20030065509A1 (en) | Method for improving noise reduction in speech transmission in communication systems | |
JP2830276B2 (ja) | 信号処理装置 | |
JP2859634B2 (ja) | 雑音除去装置 | |
JP2001166783A (ja) | 音声区間検出方法 | |
JP2000010593A (ja) | スペクトル雑音除去装置 | |
JPH08250944A (ja) | 自動音量制御方法およびこの方法を実施する装置 | |
KR100381372B1 (ko) | 음성특징 추출장치 | |
JP3111301B2 (ja) | 音声判別方法及び装置 | |
JP3032546B2 (ja) | 車両用音声認識装置 | |
US11758337B2 (en) | Audio processing apparatus | |
JPH0424692A (ja) | 音声区間検出方式 | |
Kim et al. | Sound's Direction Detection and Speech Recognition System for Humanoid Active Audition | |
JPH09127982A (ja) | 音声認識装置 | |
JPH03253899A (ja) | 音声区間検出方式 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20071008 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081008 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081008 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091008 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101008 Year of fee payment: 11 |
|
EXPY | Cancellation because of completion of term | ||
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101008 Year of fee payment: 11 |