JPH0424693A - 音声区間検出方式 - Google Patents

音声区間検出方式

Info

Publication number
JPH0424693A
JPH0424693A JP2128872A JP12887290A JPH0424693A JP H0424693 A JPH0424693 A JP H0424693A JP 2128872 A JP2128872 A JP 2128872A JP 12887290 A JP12887290 A JP 12887290A JP H0424693 A JPH0424693 A JP H0424693A
Authority
JP
Japan
Prior art keywords
noise
section
band
voice
input signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2128872A
Other languages
English (en)
Other versions
JP2989219B2 (ja
Inventor
Mitsugi Matsushita
貢 松下
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2128872A priority Critical patent/JP2989219B2/ja
Publication of JPH0424693A publication Critical patent/JPH0424693A/ja
Application granted granted Critical
Publication of JP2989219B2 publication Critical patent/JP2989219B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 投嵐分互 本発明は、音声区間検出方式、より詳細には、騒音下、
特に、自動車の中、工場の中等の騒音の中での音声認識
に用いて好適な音声区間検出方式音声認識装置を実現す
る上で、音声区間の検出は非常に重要な問題であり、以
後の認識結果に大きな影響を及ぼす。音声区間検出の一
般的なものには、新見著「音声認識」 (井守出版)の
P、68〜69に記載の二つの閾値を用いる方法がある
が、この方法では、周囲にノイズが存在するような場合
、音声区間を誤って検出してしまい、ノイズを音声であ
ると誤認識してしまうことがある。この対策として、例
えば、特開昭60−216400号公報に記載されてい
るように、周囲のノイズの大きさによって閾値を変化さ
せる方法があるが、ノイズはある帯域に偏って存在する
ことが多く、ある帯域の成分だけで前記の閾値を超えて
しまうという欠点がある。
且−一度 本発明は、上述のごとき実情に鑑みてなされたもので、
特に、周波数帯域の低い部分にノイズの大半が集中する
車の中などのように、ある帯域にノイズが偏って存在す
る状態でも、正しい音声区間を検出することのできる音
声区間検出方式を提供することを目的としてなされたも
のである・青−一戒 本発明は、上記目的を達成するために、(1)音声を集
音して電気信号に変換し、変換された入力信号をもとに
音声の存在する区間を検出する音声区間検出方式におい
て、前記入力信号を一つ以上の周波数帯域に分割し、各
帯域のパワーを求める手段と、前記入力信号のうち、音
声が存在しない区間から周囲の雑音の各帯域のパワーN
 (w)を推定して保持する手段と、該手段によって得
られた雑音の各帯域パワーN (w)が小さい帯域を強
調するようなプリエンファシスとを有し、入力信号に前
記プリエンファシスをかけた信号を用いて1区間検出を
することを特徴としたものであり、更には、(2)上記
(1)の音声区間検出方式において、前記の雑音の各帯
域パワーN (w)が、予め決められていた最小値m以
下になったとき、N (w)=mとすることを特徴とす
るものであり、更には、(3)上記(1)又は(2)の
音声区間検出方式を用いた音声認識装置を特徴とするも
のである。以下、本発明の実施例に基いて説明する。
第1図は、本発明による音声区間検出方式の一実施例を
説明するためのブロック線図、第2図は、その動作を説
明するためのフローチャートで、第1図中、1は音声入
力部、2は帯域パワー検出部、3は雑音推定部、4はプ
リエンファシス、5は音声区間検出部、6は音声認識部
である。なお、ここで用いるパワーとは、各帯域スペク
トラムの値、或いは、その自乗値である。
音声入力部1では、マイクロフォンのような音響・電気
信号変換器を用いて、音を電気信号X(1)に変換する
帯域パワー検出部2は、音声入力部1で得られた電気信
号x(t)をバンドパスフィルタ群のような帯域分割装
置を用いて、n個の帯域に分割してから、各帯域パワー
X(t、w)を検出する。(w =1.2.・・・、n
) 雑音推定部3は、音声が存在しない区間において、帯域
パワー検出部2から得られた各帯域のパワーX(t、w
)の200m5ec程度の間の平均値を求め、これを雑
音の各帯域のパワーN(w)と推定し、再度この値が更
新されるまで保持しておく。
プリエンファシス4は、雑音推定部3で推定された雑音
の帯域パワーN(w)が他の帯域パワーと比較して小さ
い場合、その帯域を強調するもので、例えば。
Y(t2w)=X(t2w)/N(w)として、y (
t)をプリエンファシスの出力とするが、他のプリエン
ファシスを用いても実現可能である。
なお、この場合、N(w)≠0の場合、Y(t。
W)、及び、y(t)が非常に大きくなってしまい、区
間検出できなくなる恐れがあるので、その対策として、
第3図に示すように、予め、N(w)の最小値mを求め
ておき、雑音の各帯域パワーN(w)が、この予め決め
られていた最小値m以下になったとき、つまり、N(w
)<mのとき、N(w)=m とするとよい。
音声区間検出部5は、プリエンファシス4の出力信号y
(t)を用いて1区間検出を行う。区間検出の方法とし
ては、第4図に示すような、2つの閾値を使う方法があ
る。この方法は予め閾値T1゜T2(T2〉T□)を決
めておき、プリエンファシス4の出力信号y(t)のパ
ワーがT1を超えた時点t□から、次にT8以下による
時点t2までの区間Sを検出し、この区間内に第二の閾
値T2を超える部分がある時に限り、この区間Sを音声
区間として検出する方法であるが、他の公知の方法を用
いても実現可能である。
音声認識部6は入力信号x(t)のうち、音声区間検出
部5で区間検出された信号のみを用いて、音声認識をす
るものであり、例えば、[2値のTSPを用いた単語音
声認識システムの開発)(安田晴剛他、電気学会論文誌
ClO3巻、昭和63年10月号p、1lls8〜86
5)記載の音声認識システムを用いるが、他の公知の音
声認識システムヲ用いても実現可能である。
処−一米 以上の説明から明らかなように、本発明によると、ノイ
ズの大半が低域に存在する車の中などのように、ある帯
域にノイズが偏っている場合、従来の方法では、ある帯
域の成分による影響だけで音声区間を誤検出することが
あったが1本発明の区間検出方式では、入力信号にノイ
ズの小さな帯域を強調するようなプリエンファシスをか
けた信号を用いて、区間検出を行っているので、従来の
方法よりも誤検出する可能が少なくなる。
また1本発明による音声区間検出方式を音声認識装置に
用いることにより、ノイズの大半が低域に存在する車の
中などのように、ある帯域にノイズが偏っている場合で
も、誤認識する可能性が少ない音声認識装置が実現する
【図面の簡単な説明】
第1図は1本発明の実施に使用して好適な電気回路のブ
ロック線図、第2図及び第3図は、それぞれ本発明の詳
細な説明するためのフローチャート、第4図は、音声区
間検出の一例を説明するためのタイムチャートである。 1・・・音声入力部、2・・帯域パワー検出部、3・・
・雑音推定部、4・・プリエンファシス、51.音声区
間検出部、6・・・音声認識部。 特許出願人   株式会社リコー 第 図 第 図 +  5 −一一一一一 力               t2第 図 第 区

Claims (1)

    【特許請求の範囲】
  1. 1、音声を集音して電気信号に変換し、変換された入力
    信号をもとに音声の存在する区間を検出する音声区間検
    出方式において、前記入力信号を1つ以上の周波数帯域
    に分割し、各帯域のパワーを求める帯域パワー検出手段
    と、前記入力信号のうち、音声が存在しない区間から周
    囲の雑音の各帯域のパワーN(w)を推定して保持する
    雑音推定手段と、前記手段によって得られた雑音の各帯
    域パワーN(w)が小さい帯域を強調するようなプリエ
    ンフアシスとを有し、入力信号に前記プリエンファシス
    をかけた信号を用いて、音声区間の検出をすることを特
    徴とした音声区間検出方式。
JP2128872A 1990-05-18 1990-05-18 音声区間検出方式 Expired - Lifetime JP2989219B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2128872A JP2989219B2 (ja) 1990-05-18 1990-05-18 音声区間検出方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2128872A JP2989219B2 (ja) 1990-05-18 1990-05-18 音声区間検出方式

Publications (2)

Publication Number Publication Date
JPH0424693A true JPH0424693A (ja) 1992-01-28
JP2989219B2 JP2989219B2 (ja) 1999-12-13

Family

ID=14995450

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2128872A Expired - Lifetime JP2989219B2 (ja) 1990-05-18 1990-05-18 音声区間検出方式

Country Status (1)

Country Link
JP (1) JP2989219B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007078186A1 (en) * 2006-01-06 2007-07-12 Realnetworks Asiapacific Co., Ltd. Method of processing audio signals for improving the quality of output audio signal which is transferred to subscriber's terminal over network and audio signal pre-processing apparatus of enabling the method
JP2012215600A (ja) * 2011-03-31 2012-11-08 Oki Electric Ind Co Ltd 音声区間判定装置、音声区間判定方法、及びプログラム

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014067148A (ja) 2012-09-25 2014-04-17 Toshiba Corp 手書き文書処理装置、方法およびプログラム

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2797616B2 (ja) 1990-03-16 1998-09-17 松下電器産業株式会社 雑音抑圧装置

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007078186A1 (en) * 2006-01-06 2007-07-12 Realnetworks Asiapacific Co., Ltd. Method of processing audio signals for improving the quality of output audio signal which is transferred to subscriber's terminal over network and audio signal pre-processing apparatus of enabling the method
US8145479B2 (en) 2006-01-06 2012-03-27 Realnetworks, Inc. Improving the quality of output audio signal,transferred as coded speech to subscriber's terminal over a network, by speech coder and decoder tandem pre-processing
US20120179459A1 (en) * 2006-01-06 2012-07-12 Realnetworks, Inc. Method and apparatus for processing audio signals
US8359198B2 (en) * 2006-01-06 2013-01-22 Intel Corporation Pre-processing and speech codec encoding of ring-back audio signals transmitted over a communication network to a subscriber terminal
US8719013B2 (en) 2006-01-06 2014-05-06 Intel Corporation Pre-processing and encoding of audio signals transmitted over a communication network to a subscriber terminal
JP2012215600A (ja) * 2011-03-31 2012-11-08 Oki Electric Ind Co Ltd 音声区間判定装置、音声区間判定方法、及びプログラム
US9123351B2 (en) 2011-03-31 2015-09-01 Oki Electric Industry Co., Ltd. Speech segment determination device, and storage medium

Also Published As

Publication number Publication date
JP2989219B2 (ja) 1999-12-13

Similar Documents

Publication Publication Date Title
CA2034354C (en) Signal processing device
EP1008140B1 (en) Waveform-based periodicity detector
NO903936D0 (no) Deteksjon av stemme-aktivitet.
DE69409121T2 (de) Störreduktionssystem für ein binaurales hörgerät
KR930007298B1 (ko) 펄스형 간섭 검출장치
CN107358964B (zh) 用于检测在变化的环境中的警戒信号的方法
JPH0424693A (ja) 音声区間検出方式
JPH08221097A (ja) 音声成分の検出法
US8788265B2 (en) System and method for babble noise detection
JP2830276B2 (ja) 信号処理装置
JP2992324B2 (ja) 音声区間検出方法
JP2001166783A (ja) 音声区間検出方法
JP2859634B2 (ja) 雑音除去装置
JP3111301B2 (ja) 音声判別方法及び装置
JP3355473B2 (ja) 音声検出方法
JPH0424692A (ja) 音声区間検出方式
JPH03269498A (ja) 雑音除去方式
JPS6336000B2 (ja)
Alias et al. A novel acoustic fingerprint method for audio signal pattern detection
JPS59228300A (ja) 音声区間検出方式
JPH0394300A (ja) 音声検出器
JPH0422999A (ja) 信号処理回路及び音声認識装置
JPS627224A (ja) 受信信号検出方式
JPH04251299A (ja) 音声区間検出方法
JP2001175299A (ja) 雑音除去装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071008

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081008

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081008

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091008

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101008

Year of fee payment: 11

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101008

Year of fee payment: 11