JPH0424693A - 音声区間検出方式 - Google Patents
音声区間検出方式Info
- Publication number
- JPH0424693A JPH0424693A JP2128872A JP12887290A JPH0424693A JP H0424693 A JPH0424693 A JP H0424693A JP 2128872 A JP2128872 A JP 2128872A JP 12887290 A JP12887290 A JP 12887290A JP H0424693 A JPH0424693 A JP H0424693A
- Authority
- JP
- Japan
- Prior art keywords
- noise
- section
- band
- voice
- input signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 29
- 230000003247 decreasing effect Effects 0.000 abstract 1
- 230000007613 environmental effect Effects 0.000 abstract 1
- 238000000034 method Methods 0.000 description 6
- 238000007796 conventional method Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 1
Abstract
め要約のデータは記録されません。
Description
特に、自動車の中、工場の中等の騒音の中での音声認識
に用いて好適な音声区間検出方式音声認識装置を実現す
る上で、音声区間の検出は非常に重要な問題であり、以
後の認識結果に大きな影響を及ぼす。音声区間検出の一
般的なものには、新見著「音声認識」 (井守出版)の
P、68〜69に記載の二つの閾値を用いる方法がある
が、この方法では、周囲にノイズが存在するような場合
、音声区間を誤って検出してしまい、ノイズを音声であ
ると誤認識してしまうことがある。この対策として、例
えば、特開昭60−216400号公報に記載されてい
るように、周囲のノイズの大きさによって閾値を変化さ
せる方法があるが、ノイズはある帯域に偏って存在する
ことが多く、ある帯域の成分だけで前記の閾値を超えて
しまうという欠点がある。
特に、周波数帯域の低い部分にノイズの大半が集中する
車の中などのように、ある帯域にノイズが偏って存在す
る状態でも、正しい音声区間を検出することのできる音
声区間検出方式を提供することを目的としてなされたも
のである・青−一戒 本発明は、上記目的を達成するために、(1)音声を集
音して電気信号に変換し、変換された入力信号をもとに
音声の存在する区間を検出する音声区間検出方式におい
て、前記入力信号を一つ以上の周波数帯域に分割し、各
帯域のパワーを求める手段と、前記入力信号のうち、音
声が存在しない区間から周囲の雑音の各帯域のパワーN
(w)を推定して保持する手段と、該手段によって得
られた雑音の各帯域パワーN (w)が小さい帯域を強
調するようなプリエンファシスとを有し、入力信号に前
記プリエンファシスをかけた信号を用いて1区間検出を
することを特徴としたものであり、更には、(2)上記
(1)の音声区間検出方式において、前記の雑音の各帯
域パワーN (w)が、予め決められていた最小値m以
下になったとき、N (w)=mとすることを特徴とす
るものであり、更には、(3)上記(1)又は(2)の
音声区間検出方式を用いた音声認識装置を特徴とするも
のである。以下、本発明の実施例に基いて説明する。
説明するためのブロック線図、第2図は、その動作を説
明するためのフローチャートで、第1図中、1は音声入
力部、2は帯域パワー検出部、3は雑音推定部、4はプ
リエンファシス、5は音声区間検出部、6は音声認識部
である。なお、ここで用いるパワーとは、各帯域スペク
トラムの値、或いは、その自乗値である。
信号変換器を用いて、音を電気信号X(1)に変換する
。
号x(t)をバンドパスフィルタ群のような帯域分割装
置を用いて、n個の帯域に分割してから、各帯域パワー
X(t、w)を検出する。(w =1.2.・・・、n
) 雑音推定部3は、音声が存在しない区間において、帯域
パワー検出部2から得られた各帯域のパワーX(t、w
)の200m5ec程度の間の平均値を求め、これを雑
音の各帯域のパワーN(w)と推定し、再度この値が更
新されるまで保持しておく。
の帯域パワーN(w)が他の帯域パワーと比較して小さ
い場合、その帯域を強調するもので、例えば。
t)をプリエンファシスの出力とするが、他のプリエン
ファシスを用いても実現可能である。
間検出できなくなる恐れがあるので、その対策として、
第3図に示すように、予め、N(w)の最小値mを求め
ておき、雑音の各帯域パワーN(w)が、この予め決め
られていた最小値m以下になったとき、つまり、N(w
)<mのとき、N(w)=m とするとよい。
(t)を用いて1区間検出を行う。区間検出の方法とし
ては、第4図に示すような、2つの閾値を使う方法があ
る。この方法は予め閾値T1゜T2(T2〉T□)を決
めておき、プリエンファシス4の出力信号y(t)のパ
ワーがT1を超えた時点t□から、次にT8以下による
時点t2までの区間Sを検出し、この区間内に第二の閾
値T2を超える部分がある時に限り、この区間Sを音声
区間として検出する方法であるが、他の公知の方法を用
いても実現可能である。
部5で区間検出された信号のみを用いて、音声認識をす
るものであり、例えば、[2値のTSPを用いた単語音
声認識システムの開発)(安田晴剛他、電気学会論文誌
ClO3巻、昭和63年10月号p、1lls8〜86
5)記載の音声認識システムを用いるが、他の公知の音
声認識システムヲ用いても実現可能である。
ズの大半が低域に存在する車の中などのように、ある帯
域にノイズが偏っている場合、従来の方法では、ある帯
域の成分による影響だけで音声区間を誤検出することが
あったが1本発明の区間検出方式では、入力信号にノイ
ズの小さな帯域を強調するようなプリエンファシスをか
けた信号を用いて、区間検出を行っているので、従来の
方法よりも誤検出する可能が少なくなる。
用いることにより、ノイズの大半が低域に存在する車の
中などのように、ある帯域にノイズが偏っている場合で
も、誤認識する可能性が少ない音声認識装置が実現する
。
ロック線図、第2図及び第3図は、それぞれ本発明の詳
細な説明するためのフローチャート、第4図は、音声区
間検出の一例を説明するためのタイムチャートである。 1・・・音声入力部、2・・帯域パワー検出部、3・・
・雑音推定部、4・・プリエンファシス、51.音声区
間検出部、6・・・音声認識部。 特許出願人 株式会社リコー 第 図 第 図 + 5 −一一一一一 力 t2第 図 第 区
Claims (1)
- 1、音声を集音して電気信号に変換し、変換された入力
信号をもとに音声の存在する区間を検出する音声区間検
出方式において、前記入力信号を1つ以上の周波数帯域
に分割し、各帯域のパワーを求める帯域パワー検出手段
と、前記入力信号のうち、音声が存在しない区間から周
囲の雑音の各帯域のパワーN(w)を推定して保持する
雑音推定手段と、前記手段によって得られた雑音の各帯
域パワーN(w)が小さい帯域を強調するようなプリエ
ンフアシスとを有し、入力信号に前記プリエンファシス
をかけた信号を用いて、音声区間の検出をすることを特
徴とした音声区間検出方式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2128872A JP2989219B2 (ja) | 1990-05-18 | 1990-05-18 | 音声区間検出方式 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2128872A JP2989219B2 (ja) | 1990-05-18 | 1990-05-18 | 音声区間検出方式 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH0424693A true JPH0424693A (ja) | 1992-01-28 |
JP2989219B2 JP2989219B2 (ja) | 1999-12-13 |
Family
ID=14995450
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2128872A Expired - Lifetime JP2989219B2 (ja) | 1990-05-18 | 1990-05-18 | 音声区間検出方式 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2989219B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2007078186A1 (en) * | 2006-01-06 | 2007-07-12 | Realnetworks Asiapacific Co., Ltd. | Method of processing audio signals for improving the quality of output audio signal which is transferred to subscriber's terminal over network and audio signal pre-processing apparatus of enabling the method |
JP2012215600A (ja) * | 2011-03-31 | 2012-11-08 | Oki Electric Ind Co Ltd | 音声区間判定装置、音声区間判定方法、及びプログラム |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014067148A (ja) | 2012-09-25 | 2014-04-17 | Toshiba Corp | 手書き文書処理装置、方法およびプログラム |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2797616B2 (ja) | 1990-03-16 | 1998-09-17 | 松下電器産業株式会社 | 雑音抑圧装置 |
-
1990
- 1990-05-18 JP JP2128872A patent/JP2989219B2/ja not_active Expired - Lifetime
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2007078186A1 (en) * | 2006-01-06 | 2007-07-12 | Realnetworks Asiapacific Co., Ltd. | Method of processing audio signals for improving the quality of output audio signal which is transferred to subscriber's terminal over network and audio signal pre-processing apparatus of enabling the method |
US8145479B2 (en) | 2006-01-06 | 2012-03-27 | Realnetworks, Inc. | Improving the quality of output audio signal,transferred as coded speech to subscriber's terminal over a network, by speech coder and decoder tandem pre-processing |
US20120179459A1 (en) * | 2006-01-06 | 2012-07-12 | Realnetworks, Inc. | Method and apparatus for processing audio signals |
US8359198B2 (en) * | 2006-01-06 | 2013-01-22 | Intel Corporation | Pre-processing and speech codec encoding of ring-back audio signals transmitted over a communication network to a subscriber terminal |
US8719013B2 (en) | 2006-01-06 | 2014-05-06 | Intel Corporation | Pre-processing and encoding of audio signals transmitted over a communication network to a subscriber terminal |
JP2012215600A (ja) * | 2011-03-31 | 2012-11-08 | Oki Electric Ind Co Ltd | 音声区間判定装置、音声区間判定方法、及びプログラム |
US9123351B2 (en) | 2011-03-31 | 2015-09-01 | Oki Electric Industry Co., Ltd. | Speech segment determination device, and storage medium |
Also Published As
Publication number | Publication date |
---|---|
JP2989219B2 (ja) | 1999-12-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CA2034354C (en) | Signal processing device | |
EP1008140B1 (en) | Waveform-based periodicity detector | |
NO903936D0 (no) | Deteksjon av stemme-aktivitet. | |
DE69409121T2 (de) | Störreduktionssystem für ein binaurales hörgerät | |
KR930007298B1 (ko) | 펄스형 간섭 검출장치 | |
CN107358964B (zh) | 用于检测在变化的环境中的警戒信号的方法 | |
JPH0424693A (ja) | 音声区間検出方式 | |
JPH08221097A (ja) | 音声成分の検出法 | |
US8788265B2 (en) | System and method for babble noise detection | |
JP2830276B2 (ja) | 信号処理装置 | |
JP2992324B2 (ja) | 音声区間検出方法 | |
JP2001166783A (ja) | 音声区間検出方法 | |
JP2859634B2 (ja) | 雑音除去装置 | |
JP3111301B2 (ja) | 音声判別方法及び装置 | |
JP3355473B2 (ja) | 音声検出方法 | |
JPH0424692A (ja) | 音声区間検出方式 | |
JPH03269498A (ja) | 雑音除去方式 | |
JPS6336000B2 (ja) | ||
Alias et al. | A novel acoustic fingerprint method for audio signal pattern detection | |
JPS59228300A (ja) | 音声区間検出方式 | |
JPH0394300A (ja) | 音声検出器 | |
JPH0422999A (ja) | 信号処理回路及び音声認識装置 | |
JPS627224A (ja) | 受信信号検出方式 | |
JPH04251299A (ja) | 音声区間検出方法 | |
JP2001175299A (ja) | 雑音除去装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20071008 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081008 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081008 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091008 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101008 Year of fee payment: 11 |
|
EXPY | Cancellation because of completion of term | ||
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101008 Year of fee payment: 11 |