JPS63127295A - 音声区間検出方式 - Google Patents

音声区間検出方式

Info

Publication number
JPS63127295A
JPS63127295A JP61274288A JP27428886A JPS63127295A JP S63127295 A JPS63127295 A JP S63127295A JP 61274288 A JP61274288 A JP 61274288A JP 27428886 A JP27428886 A JP 27428886A JP S63127295 A JPS63127295 A JP S63127295A
Authority
JP
Japan
Prior art keywords
voice
samples
voice section
detection method
section
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP61274288A
Other languages
English (en)
Inventor
潤一郎 藤本
金内 邦容
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP61274288A priority Critical patent/JPS63127295A/ja
Publication of JPS63127295A publication Critical patent/JPS63127295A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 技4分見 本発明は、音声認識における音声区間の検出に関する。
丈米挟亙 音声認識装置を実現する上で音声区間をいかに忠実に切
り出すかは非常に重要であり、この音声区間の切り出し
が装置の能力を左右する。音声区間の切り出し方はいく
つか考えられるが、その代表的なものは第5図に示すよ
うなもので、図示のように、閾値T1を決めておき、入
力された信号のエルネギ−が該閾値T1を越えた時点t
1から該閾値T1を下る時点t2までを音声区間Sとす
るものである。ただし、この区間内に第2の閾値T2(
T2>T、)を越える部分がある時に限り、上記区間を
音声区間とする。しかし、音声を発声するために息を吸
い込むと、空気が歯の間を通過する音がマイクを通して
入力され、この音が音声の区間として検出されてしまう
という欠点がある。これを避けるためにT1或いはT2
を大きくとることも考えられるが、これによって音声の
冒頭につく子音が欠落してしまう欠点がある。
」的 本発明は、上述のごとき実情に鑑みてなされたもので、
特に、息音等をとり除いて正しい音声区間を検出するこ
とのできる音声区間検出方式を提供することを目的とし
てなされたものである。
構   成 本発明は、上記目的を達成するために、音声を集音して
電気信号に変換し、変換された信号中から音声に係る部
分だけを抽出する音声検出方式において、(1)第1の
音声区間検出法によって検出した音声区間候補の始端か
ら周波数分析し、周波数帯域をいくつかに分割し、各帯
域のエネルギーが同時に一定値以下になるサンプル数を
計測すると共に全体のエネルギーが別に定められた値を
越えるサンプル数を計測し、一方のサンプル数がある値
に達する前に他方のサンプル数が定められた値に達する
かどうかにより、前記音声区間候補が有効であるかどう
かを判定するようにしたこと、或いは、(2)第1の音
声区間検出法によって検出した音声区間の候補の始端か
ら周波数分析し。
周波数帯域をいくつかに分割し、各帯域のエネルギーが
同時に一定値以下になるサンプル数を計測すると共に全
体のエネルギーが別に定められた値を越えるサンプル数
を計測し、一方のサンプル数がある値に達する前に他の
サンプル数が定められた値に達しない時、前記音声候補
の始端をずらして正しい音声区間を決めるようにしたこ
とを特徴としたものである。以下、本発明の実施例に基
づいて説明する。
第1図は、本発明による音声区間検出方式の一実施例を
説明するためのブロック線図、第2図は、第1図の動作
説明をするためのフローチャートで、図中、1はマイク
ロフォン等の音響電気信号変換器、2は区間候補検出部
、3はバンドパスフィルタ、4〜8は比較器、9は加算
器、10.11は基準値(E、、 F2)発生部、12
はAND回路、13はスイッチ(AND回路12の結果
が1の時オンする)、14.15はカウンタ、16,1
7は基準値部、18は音声区間取り消し信号発生部、1
9は音声認識処理部である。而して、本発明は、息を吸
う時に発せられる音は周波数の帯域が広く、各々の帯域
中の成分は小さいことに着目してなされており、具体的
には、音声を集音して電気信号に変換し、変換された信
号中から音声に係る部分だけを抽出する音声検出方式に
おいて、第1の音声区間検出法によって検出した音声区
間候補の始端から周波数分析し、周波数帯域をいくつか
に分割し、各帯域のエネルギーが同時に一定値以下にな
るサンプル数を計測すると共に全体のエネルギーが別に
定められた値を越えるサンプル数を計測し、一方のサン
プル数がある値に達する前に他方のサンプル数が定めら
れた値に達するかどうかにより、前記音声区間候補が有
効であるかどうかを判定するようにしたものである。第
1図及び第2図において、マイク1から入ってくる音に
対して、まず、音声区間候補検出部2により音声区間ら
しさを持つ部分をみつけ、区間候補信号を音声認識装W
19へ送る。これと同時に、この区間候補信号はバンド
パスフィルタ3により3つ程度の帯域に分けられる。こ
こでは、それらをFl、F2゜F、と表わすが、これら
Fl、 F、、 F、の出力が決められた値ε1より大
きい時に各比較器4,5゜6から信号を出し、AND回
路12へ入力される。
AND回路12ではF、、 F、、 F、の全てがε、
より小なる時にハイ(High)の信号を出し、その時
のサンプル数がカウンタ14にて計数される。一方、 
F、、 F2. F3各々は加算器9により加算されて
音声のエネルギーとみなされるが、この値が第2の定め
られた値ε2より大きいかどうかを比べ、大きい部分の
サンプル数をカウンタ15により数えてC2とする。音
声候補の始端から例えば100n+s程度の間でC2>
 Ctならば、先の候補始端は正しい音声だとし、C,
>C,の時は音声信号ではないという音声区間取り消し
信号を出す。
ε2は必ずしもC2> Ctである必要はなく多少の余
裕をもたせるためのものである。特に、C2は音声に母
音らしさが出ている値であり、母音を発してエネルギー
を求め、それらの平均の1/2程度で決めれば良い。ま
た、ε、は帯域が広く、各々の帯域での成分の大きさは
第5図のT1とT2の間位が望ましい。区間候補の決め
方は特に限定するものではなく、第5図に示した方法な
ど一般的に知られたもののどれでも良い。また、音声を
取り消すだけでなく、C1< Czになったところが正
しい音声の始端であると考えて始端候補の始端をずらす
という方法も考えられる。
第3図は、上述のごとくして始端候補の始端をずらした
ようにした場合の一実施例を説明するためのブロック線
図、第4図は、第3図の動作説明をするためのフローチ
ャートで、図中、20は始端ずらし信号発生部で、その
他第1図に示した実施例と同様の作用をする部分には第
1図の場合と同一の参照番号を付しである。而して、本
実施例は、前述のようにC,<C,になったところが正
しい音声の始端であると考えて、この始端候補の始端を
始端ずらし信号発生部20でずらすようにしたものであ
る。
効   果 以上の説明から明らかなように、本発明によると、息等
の音を取り除いて正しい音声区間の検出が可能になる。
【図面の簡単な説明】
第1図は、本発明による音声区間検出方式の一実施例を
説明するためのブロック線図、第2図は、第1図の動作
説明をするためのフローチャート、第3図は、本発明の
他の実施例を説明するためのブロック線図、第4図は、
第3図の動作説明をするためのフローチャート、第5図
は、従来の音声区間検出方式の一例を説明するための音
声パワー波形図である。 1・・・マイクロフォン、2・・・区間候補検出部、3
・・・バンドパスフィルタ、4〜8・・・比較器、9・
・・加算器、10.11・・・基準値発生部、12・・
・AND回路、13・・・スイッチ、14,15・・・
カウンタ。 16.17・・・基準値、18・・・音声区間取り消し
信号発生部、19・・・音声認識処理部、20・・・始
端ずらし信号発生部。 特許出願人   株式会社 リコー 第  1  図 第3図 第5図

Claims (2)

    【特許請求の範囲】
  1. (1)音声を集音して電気信号に変換し、変換された信
    号中から音声に係る部分だけを抽出する音声検出方式に
    おいて、第1の音声区間検出法によって検出した音声区
    間候補の始端から周波数分析し、周波数帯域をいくつか
    に分割し、各帯域のエネルギーが同時に一定値以下にな
    るサンプル数を計測すると共に全体のエネルギーが別に
    定められた値を越えるサンプル数を計測し、一方のサン
    プル数がある値に達する前に他方のサンプル数が定めら
    れた値に達するかどうかにより、前記音声区間候補が有
    効であるかどうかを判定するようにしたことを特徴とす
    る音声区間検出方式。
  2. (2)音声を集音して電気信号に変換し、変換された信
    号中から音声に係る部分だけを抽出する音声検出方式に
    おいて、第1の音声区間検出法によって検出した音声区
    間の候補の始端から周波数分析し、周波数帯域をいくつ
    かに分割し、各帯域のエネルギーが同時に一定値以下に
    なるサンプル数を計測すると共に全体のエネルギーが別
    に定められた値を越えるサンプル数を計測し、一方のサ
    ンプル数がある値に達する前に他のサンプル数が定めら
    れた値に達しない時、前記音声候補の始端をずらして正
    しい音声区間を決めるようにしたことを特徴とする音声
    区間検出方式。
JP61274288A 1986-11-18 1986-11-18 音声区間検出方式 Pending JPS63127295A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61274288A JPS63127295A (ja) 1986-11-18 1986-11-18 音声区間検出方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61274288A JPS63127295A (ja) 1986-11-18 1986-11-18 音声区間検出方式

Publications (1)

Publication Number Publication Date
JPS63127295A true JPS63127295A (ja) 1988-05-31

Family

ID=17539559

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61274288A Pending JPS63127295A (ja) 1986-11-18 1986-11-18 音声区間検出方式

Country Status (1)

Country Link
JP (1) JPS63127295A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002244697A (ja) * 2001-02-16 2002-08-30 Casio Comput Co Ltd 音声認証装置、音声認証方法、及びプログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002244697A (ja) * 2001-02-16 2002-08-30 Casio Comput Co Ltd 音声認証装置、音声認証方法、及びプログラム

Similar Documents

Publication Publication Date Title
DE68929442T2 (de) Vorrichtung zur Erfassung von Sprachlauten
US6285979B1 (en) Phoneme analyzer
Kolhatkar et al. Implementation of pitch detection algorithms for pathological voices
JP4926588B2 (ja) がいし放電音判別方法及びその装置
JPS58194100A (ja) 音声分析システム
JPS63127295A (ja) 音声区間検出方式
Doherty An evaluation of selected acoustic parameters for use in speaker identification
JP2648779B2 (ja) 通話信号識別装置
JP2882792B2 (ja) 標準パターン作成方式
JPS58150995A (ja) 発音特徴抽出装置
JPS63127296A (ja) 音声区間検出方式
JP4360527B2 (ja) ピッチ検出方法
Heckmann et al. Sound source separation for a robot based on pitch
JP2557497B2 (ja) 男女声の識別方法
JPS59228300A (ja) 音声区間検出方式
JP3550871B2 (ja) 音声認識方法及び装置
SU1781701A1 (en) Method of separation of speech and nonstationary noise signals
JPH05322640A (ja) ヘリコプタ音の抽出・識別装置
JPS63226692A (ja) パターン比較方式
JPS63127294A (ja) 音声区間検出方式
JPS6315298A (ja) パタ−ン作成方式
JPS63163495A (ja) 音声区間検出装置
JPS6329759B2 (ja)
KR20010046522A (ko) 피치 정보를 이용한 실시간 음성 검출 장치 및 그 방법
JPS5923397A (ja) 音声認識装置