JPS61259296A - 音声区間検出方式 - Google Patents

音声区間検出方式

Info

Publication number
JPS61259296A
JPS61259296A JP60100529A JP10052985A JPS61259296A JP S61259296 A JPS61259296 A JP S61259296A JP 60100529 A JP60100529 A JP 60100529A JP 10052985 A JP10052985 A JP 10052985A JP S61259296 A JPS61259296 A JP S61259296A
Authority
JP
Japan
Prior art keywords
level
threshold
input
time
level threshold
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP60100529A
Other languages
English (en)
Inventor
陽一 山田
林 逸夫
松下 満次
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP60100529A priority Critical patent/JPS61259296A/ja
Publication of JPS61259296A publication Critical patent/JPS61259296A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は音声認識装置における音声区間検出方式%式% (従来の技術) 従来の音声区間検出方式として音声入力時の雑音レベル
、入力音声レベル等よりレベル閾値を設定し、その閾値
と比較して入カレベル信号が大である状態が定められた
一定時間以上継続した時始端とする。その後、入カレベ
ル信号が前記設定された閾値と比較して小である状態が
定められた一定時間以上継続した時終端とし、この判定
により決定された始端から終端までを入力音声の音声区
間として検出していた。
第2図は横軸を時刻として入カレベル信号変化の−例を
示したものである。第2図により上記音声区間検出動作
を説明する。入カレベル信号全時刻tの関数S (t)
とし、雑音レベル及び入力音声レベル等により設定され
る音声区間検出用のレベル閾値をLTHとする。また、
始端を決定する条件S CL) >LTH を満足する最小の継続時間である所定の継続時間をTS
とし、終端を決定する条件 S (t)≦LTH を満足する最小の継続時間である所定の継続時間をTE
とする。第2図において、 F  r  j2  e・
・・。
t6は入カレベル信号S (t)に対しレベル閾値り丁
Hと交差する時刻を示す。
まず始端の検出を行ない、レベル閾値LATHを継続時
間79以上越える区間の開始点t3を始端と決定し、次
に終端検出を行ない前記レベル閾値LTHを前記m続時
間TE以上下回る区間の開始点上6を終端と決定する。
(発明が解決しようとする問題点) しかしながら、前記音声区間検出方式では次のような問
題点がある。
電話機あるいはマイク等により入力される音声において
、前述した如く入力信号レベルの大きさ、レベル閾値の
両者の大小関係により音声区間検出を行なう方式では、
レベル閾値を小さく設定した場合には、音声成分以外の
不必要な雑音成分を音声区間として誤検出する、あるい
は音声発生終了直後に発生する呼吸音等の残留音の影響
による入力信号レベルの減衰率低下に起因する終端決定
時刻の遅延が起こる1等の欠点が生じる。
また、これを避けるため前記閾値を大きく設定した場合
には、一般的に認識処理を行なうに際し重要な情報源と
なる子音部(入力信号レベルが定常的な母音部に比較し
て小となる非定常的な子音部)が含まれている音声発生
開始直後の立上がり部分を音声区間として検出しないと
いう欠点が生じる。
従って、音声区間検出を安定かつ正確に行なうことがで
きず、音声認識性能へ多大な悪影響を及ぼすという欠点
があった。
本発明は1以上述べた欠点を除去し、入力音声の音声区
間を安定かつ正確に検出することが可能な音声区間検出
方式を提供することを目的とする。
(問題点を解決するための手段) 本発明は前記問題点を解決するために、入カレベル信号
に基づいてレベル閾値を設定し、入カレベル信号とレベ
ル閾値とを比較することにより、音声区間を検出する音
声区間検出方式において、前記入カレベル信号の変化量
を抽出する抽出手段を設け、 前記レベル閾値として第1のレベル閾値、該第1のレベ
ル閾値より低レベルの第2のレベル闇値、始端検出用の
第3のレベル閾値及び終端検出用の第4のレベル閾値を
設定し、 前記入カレベル信号が第1のレベル閾値を超える状態、
又は前記入カレベル信号が第2のレベル閾値を超え且つ
前記抽出手段の出カレベルが第3のレベル闇値を超える
状態が第1の所定時間以上継続したときの開始時刻を音
声区間の始端とし、前記入カレベル信号が第2のレベル
閾値以下となる状態、又は前記入カレベル信号が第1の
レベル閾値以下で且つ前記抽出手段の出カレベルが第4
のレベル閾値以上となる状態が第2の所定時間以上継続
したときの開始時刻を音声区間の終端とするものである
(作用) 本発明によれば以上のように音声区間検出方式を構成し
たので次のように作用する。始端検出法において、入カ
レベル信号と第2のレベル閾値とを比較し、且つ抽出手
段の出カレベルと第3のレベル閾値とを比較することに
より、音声成分か雑音成分かを識別できるように作用す
る。また、終端検出時において、入カレベル信号と第1
のレベル闇値とを比較し、且つ抽出手段の出カレベルと
第4のレベル閾値とを比較することにより、残留音の影
響による終端決定時刻の遅延を防ぐように作用する。従
って、従来技術の問題点が解決できるのである。
(実施例) 第1図は本発明の実施例を示すブロック図である。同図
において、lはレベル抽出部、2はレベル変化量抽出部
、3は闇値設定部、4は閾値設定部、5は制御部である
レベル抽出部lは入力信号S1が入力されると。
入力信号S1のレベル抽出を行ない、入カレベル信号S
2に変換し、レベル変化量抽出部2.閾値設定部3と音
声区間検出部4へ出力する。
レベル変化量抽出部2は入カレベル信号S2を入力とし
てその一定時間毎の変化量を求め、入カレベル変化量信
号S3として音声区間検出部4へ出力する。
制御部5は音声発声中でないと想定される時刻において
閾値設定部3へ閾値設定指令信号S4を出力する。
閾値設定部3は、制御部5からの閾値設定指令信号S4
が入力した時刻における入カレベル信号S2を入力とし
て、始端検出、終端検出に際し使用する低レベル閾値S
5と低レベル閾値S5より大きい高レベル閾値S8.始
端検出に際し使用する始端検出用のレベル変化量閾値S
7.及び終端検出に際し使用する終端検出用のレベル変
化量閾値S8をそれぞれ設定する。これらの各間値S5
乃至S8は例えば次のように設定する。即ち、低レベル
閾値S5は音声入力時における入カレベル信号S2の最
大値として想定される値の10〜20%、高レベル閾値
S8は音声入力時における入カレベル信号S2の最大値
として想定される値の30〜40%、始端検出用のレベ
ル変化量閾値S7は音声入力時における入カレベル信号
S2の最大値として想定される値の+(30〜40)%
、終端検出用のレベル変化量閾値S8は音声入力時にお
ける入カレベル信号S2の最大値として想定される値の
−(30〜40)%程度に設定すれば良い。
闇値設定部3は前記設定した各間値S5乃至S8を音声
区間検出部4へ出力するとともに、閾値設定終了信号S
9を制御部4へ出力する。
制御部5は、閾値設定部3より閾値設定終了信号S8が
入力されると、音声区間検出指令信号SIOを音声区間
検出部4へ出力する。
音声区間検出部4は、制御部5より音声区間検出指令信
号S10が入力されると、入カレベル信号S2.入カレ
ベル変化量信号S3.低レベル閾値S5゜高レベル閾値
S6.始端検出用レベル変化量閾値S?、及び終端検出
用レベル変化量閾値S8を入力として音声区間検出を行
ない、音声区間始端時刻S11と音声区間終端時刻S1
2を制御部5へ出力する。
次に第3図の入カレベル信号S2の具体例を用いて音声
区間検出部4の動作を詳細に説明する。
第3図は横軸を時刻tとして入カレベル信号及び入カレ
ベル変化量信号と各閾値との関係を示すものである。入
カレベル信号S2を時刻りの関数5(t)、入カレベル
変化量信号S3例えば5(t)のtに対する微分量を時
刻tの関数s’(t)、低レベル閾値S5をLTHL、
高レベル閾値SθをLTHH1始端検出用のレベル変化
量閾値S7をDLTHS及び終端検出用のレベル変化量
閾値S8をDLTHEとする。また、始端を決定する始
端条件 (5(t)>LT)IH)又ハ(5(t)>LTHLカ
ッS’(t) >DLTHS) を満足する最小の継続時間である所定の継続時間をTS
とし、終端を決定する終端条件 (5(t)≦LTHL )又は(5(t)≦LTI(I
(かつS’ (t)≧0LTHE ) を満足する最小の継続時間である所定の継続時間をTE
とする。
第3図において、入カレベル信号5(t)に対し、まず
始端の検出を行ない、前記始端条件を所定の継続時間T
S以上満足する区間の開始時刻t1を始端と決定する。
次に、終端の検出を行ない、前記終端条件を所定の継続
時間TE以上満足する区間の開始時刻t2を終端と決定
する。即ち、時刻tAから時刻tCまでの雑音成分と推
定される部分に対して前記始端条件の後 者の条件を満
足する区間は最初に低レベル閾 値LTHLを超え、か
つ始端検出用のレベル変化量間 値[)LTH5を超え
る時刻tAからレベル変化量間 値[ILTI(S以下
となる時刻を日までとなるがその継続時間はtB−tA
< TSとなる。従って、前記始端条件の前記継続時間
TS以上を満足しないため、tAは始端とせず時刻tA
から時刻tCまでを雑音成分とみなし、音声区間として
誤検出することを防止する0次に、2番目に低レベル閾
値LTHLt−超えかつ始端検出用のレベル変化量閾値
DLT)ISを超える時刻t1から高レベル閾値LTH
Hを超える時刻tDまでの音声信号立上り部分に対して
は、前記始端条件を満足し、さらに時刻t1より継続時
間79以上継続している。従って、音声信号の立上り時
刻t1が正確に始端として検出される。
始端検出後、高レベル閾値LT)IH以下となる時刻t
2から低レベル閾値LTHL以下となる時刻tEまでの
音声発生終了直後の残留音を含むと想定される部分(第
3図斜線部)に対しては、前記終端条件の後者の条件を
満足し、さらに時刻t2より前記継続時間TE以上継続
する。従って、音声発生終了時刻t2を終端として検出
し、従来方式による欠点となっていた残留音の影響によ
る終端決定時刻の遅延を防いでいる。
以上の如く、安定かつ正確、さらに終端の検出が遅延な
しに行なわれる音声区間検出の実現が可能となる。
(発明の効果) 以上詳細に説明したように本発明によれば、比較的大き
い値をもつ高レベル閾値、比較的小さい値をもつ低レベ
ル閾値、始端検出用レベル変化量閾値、終端検出用レベ
ル変化量閾値を別個に設定し、入力信号レベル、入力信
号レベル変化量と前記各閾値間の大小関係の比較により
始端及び終端の検出を行なう音声区間検出方式としたの
で、一般的に発生し易い雑音成分の誤検出、残留音によ
る終端決定時刻の遅延なしに安定かつ正確な音声区間検
出を行なうことができ、音声認識装置における認識率の
向上が期待できる。
【図面の簡単な説明】
第1図は本発明の一実施例を示すブロック図、第2図は
従来の音声区間検出方式を説明する図、第3図は第1図
の実施例を説明する図である。 l・・パレベル抽出部、  2・・・レベル変化量抽出
部、3・・・闇値設定部、   4・・・音声区間検出
部、5・・・制御部。

Claims (1)

  1. 【特許請求の範囲】 入カレベル信号に基づいてレベル閾値を設定し、入力レ
    ベル信号とレベル閾値とを比較することにより、音声区
    間を検出する音声区間検出方式において、 前記入力レベル信号の変化量を抽出する抽出手段を設け
    、 前記レベル閾値として第1のレベル閾値、該第1のレベ
    ル閾値より低レベルの第2のレベル閾値、始端検出用の
    第3のレベル閾値及び終端検出用の第4のレベル閾値を
    設定し、 前記入力レベル信号が第1のレベル閾値を超える状態、
    又は前記入力レベル信号が第2のレベル閾値を超え且つ
    前記抽出手段の出力レベルが第3のレベル閾値を超える
    状態が第1の所定時間以上継続したときの開始時刻を音
    声区間の始端とし、前記入力レベル信号が第2のレベル
    閾値以下となる状態、又は前記入力レベル信号が第1の
    レベル閾値以下で且つ前記抽出手段の出力レベルが第4
    のレベル閾値以上となる状態が第2の所定時間以上継続
    したときの開始時刻を音声区間の終端とすることを特徴
    とする音声区間検出方式。
JP60100529A 1985-05-14 1985-05-14 音声区間検出方式 Pending JPS61259296A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60100529A JPS61259296A (ja) 1985-05-14 1985-05-14 音声区間検出方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60100529A JPS61259296A (ja) 1985-05-14 1985-05-14 音声区間検出方式

Publications (1)

Publication Number Publication Date
JPS61259296A true JPS61259296A (ja) 1986-11-17

Family

ID=14276488

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60100529A Pending JPS61259296A (ja) 1985-05-14 1985-05-14 音声区間検出方式

Country Status (1)

Country Link
JP (1) JPS61259296A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4810044B2 (ja) * 2000-01-27 2011-11-09 ニュアンス コミュニケーションズ オーストリア ゲーエムベーハー 2つのスイッチオフ規準を持つ音声検出装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4810044B2 (ja) * 2000-01-27 2011-11-09 ニュアンス コミュニケーションズ オーストリア ゲーエムベーハー 2つのスイッチオフ規準を持つ音声検出装置

Similar Documents

Publication Publication Date Title
US4357491A (en) Method of and apparatus for detecting speech in a voice channel signal
US6088670A (en) Voice detector
JPS5852695A (ja) 車両用音声検出装置
JPS61259296A (ja) 音声区間検出方式
EP0047589A1 (en) Method and apparatus for detecting speech in a voice channel signal
JPS62237498A (ja) 音声区間検出方法
JPS61140999A (ja) 音声区間検出方式
JPS62141595A (ja) 音声検出方式
JPH1195785A (ja) 音声区間検出方式
JPH0673079B2 (ja) 音声区間検出回路
JPH07109559B2 (ja) 音声区間検出方法
JP3096564B2 (ja) 音声検出装置
JPS607497A (ja) 音声認識装置
JPH0376471B2 (ja)
JPS60101598A (ja) 音声区間検出装置
JPS63155196A (ja) 無声音検出方法
JP3033537B2 (ja) 音声検出器
JPS5834986B2 (ja) 適応形音声検出回路
JPS6247319B2 (ja)
JPS63220295A (ja) 音声区間検出方式
JPS61269197A (ja) 音声区間検出方式
JPS59231600A (ja) 音声区間検出方法
JPS61259297A (ja) 音声区間検出方式
JPS6267598A (ja) 音声区間検出方式
JPS61272796A (ja) 音声区間検出方式