JPS61140999A - 音声区間検出方式 - Google Patents

音声区間検出方式

Info

Publication number
JPS61140999A
JPS61140999A JP59261738A JP26173884A JPS61140999A JP S61140999 A JPS61140999 A JP S61140999A JP 59261738 A JP59261738 A JP 59261738A JP 26173884 A JP26173884 A JP 26173884A JP S61140999 A JPS61140999 A JP S61140999A
Authority
JP
Japan
Prior art keywords
voice
level
voice section
section
threshold
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP59261738A
Other languages
English (en)
Inventor
陽一 山田
林 逸夫
堀 孝生
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP59261738A priority Critical patent/JPS61140999A/ja
Publication of JPS61140999A publication Critical patent/JPS61140999A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は音声認識装置における音声区間検出方式に関す
るものである。
(従来の技術) 従来の音声区間検出方式として、音声入力時の雑音レベ
ル、入力音声レベル等よりレベル閾値を設定しその閾値
と比較して入力レベル信号が大である状態が定められた
一定時間以上継続した時音声区間始端とし、その後入力
レベル信号が前記設定された閾値と比較して小である状
態が定められた一定時間以上継続した時音声区間終端と
し、上記判定により決定された始端から終端までを音声
区間として検出していた。
第2図は横軸を時刻として入力レベル信号変化の一例を
示したものである。第2図により上記動作を説明する。
入力レベル信号を時刻tの関数5(1)とし、雑音レベ
ル、入力音声レベル等より設定される音声区間検出用レ
ベル閾値をLTH1音声区間始端を決定する条件 5(t)>LTH なる状態の最低継続時間である音声区間始端決定高レベ
ル入力最低継続時間をTSとし、音声区間終端を決定す
る条件 S (t)≦LTH なる状態の最低継続時間である音声区間終端決定低レベ
ル入力最低継続時間をTEする。第2図において入力レ
ベル信号5(t)に対し前記閾値LTHと交差する時刻
をそれぞれtl、t2.・・・t8とする。まず始端の
検出を行ない、該閾値LTHを前記継続時間73以上越
える区間の始端を音声区間始端と決定し、次に終端検出
を行ない前記閾値LTHを前記継続時間TE以上下回る
区間の始端を音声区間終端と決定する0本例の場合、音
声区間始端はt3、音声区間終端はt8と決定される。
(発明が解決しようとする問題点) しかしながら電話機あるいはマイク等により入力される
音声において、音声発声終了直後の入力レベル信号は一
般的に呼吸音等の残留音の影響により音声レベルの減衰
率が発声時間に対して小さく、更にばらつきが大きいた
め、前記継続時間TEを大きく設定した場合、音声終端
の検出が遅れるという欠点が生じ、またこれを避けるた
め前記TEを小さく設定するとばらつきが大きく更に雑
音等の影響を受は易くいずれにしても音声区間終端が安
定かつ正確に検出できず更に終端検出が遅れるという欠
点があった。
音声区間の検出の誤差は音声認識の精度に直接影響する
0本発明は以上述べた欠点を除去するため、音声発声直
後の入力レベル信号が、前記残留音の影響によりばらつ
きが発生し、あるいは雑音が混入しても安定かつ正確に
検出し、更に音声の終端をも遅延なく検出する音声区間
検出方式を提供することを目的とする。
(問題点を解決するための手段) 上記目的を達成するための本発明の特徴は、音声の終端
検出用のレベル閾値を、始端検出用のレベル閾値よりも
高く設定することにある。
(作用) 音声区間の終端検出用レベル閾値が高いので、音声発声
終了直後の、呼吸音等の残留音の影響による音声レベル
の減衰率のパーラツキの影響をうけずに、雑音等に妨害
されずに正確に音声区間を検出することができる。更に
終端検出のための継続時間を短く設定することが出来る
ので、終端検出が遅れることもない、従って上記目的が
達成される。
(実施例) 第1図は本発明の実施例を示すブロック図である。第1
図おいてlは入力信号、2は入力信号lを入力しその入
力信号lからレベルの抽出を行なうレベル抽出部であり
、入力信号lを入力レベル信号4に変換する。制御部3
は音声発声中でないと想定される時刻において閾値設定
部6へ閾値設定指令信号5を出力する。閾値設定部6は
閾値設定指令信号5を入力した時刻における入力レベル
信号4を入力として、音声区間始端検出に際し使用する
比較的低い音声区間始端検出用レベル閾値8と、音声区
間終端検出に際し使用する始端検出用レベル閾値8より
高い音声区間終端検出用レベル閾値9を設定し、音声区
間検出部10へ出力するとともに、閾値設定終了信号7
を制御部3へ出力する。制御部3は閾値設定部6より閾
値設定終了信号7を入力後、音声区間検出指令信号10
を音声区間検出部11へ出力する。音声区間検出部11
は制御部3より音声区間検出指令信号4oを入力後、入
力レベル信号4、音声区間始端検出用レベル閾値8、及
び音声区間終端検出用レベレ閾値9を入力として音声区
間検出を行ない、音声区間始端時刻12と音声区間終端
時刻13を制御部3へ出力する。
第3図は横軸を時刻として入力レベル信号変化の一例と
本発明の実施例を示したものである。入力レベル信号を
時刻tの関数5(t)、音声区間始端検出用レベル閾値
をLTH3、音声区間終端検出用レベル閾値をLTHE
、とする、また音声区間始端を決定する条件 5(t)>LTH3 なる状態の最低継続時間である音声区間始端決定高レベ
ル入力最低継続時間をTS、音声区間終端を決定する条
件 5(t)<LTHE なる状態の最低継続時間である音声区間終端決定低レベ
ル入力最低継続時間をTEとする。第3図において、入
力レベル信号S (t)に対しまず始端の検出を行ない
、前記閾値LTH3を前記継続時間73以上越える区間
の始端を音声区間始端と決定し、次に前記閾値LTHE
を前記粛続時間TE以上下興る区間の始端を音声区間終
端と決定される0本実施例の場合、音声区間始端はtl
、音声区間終端はt2と決定される。第3図による実施
例において、音声発声終了前後に斜線部の如き残留音成
分の影響により入力レベル信号の減衰率が小さくなるこ
との影響を軽減するために、前記終端検出用閾値LTH
Eを前記始端検出用閾値LTH3に比較して高く設定す
る。これにより、残留音の有無等による発声音量のばら
つきに対する音声区間終端時刻のずれの大きさく図中A
の範囲)は、音声区間検出検出用レベル閾値LTHEを
前記閾値LTH3と同じ値としたときの音声区間終端時
刻のずれ(図のBの範囲)よりも極めて小さくなる。従
って終端決定継続時間TEを短かく設定しても安定かつ
正確で終端検出の遅れることのない音声区間の検出が可
能となる。
なお、LTH5とTHEのレベル値はノイズレベルに関
係し、例えばノイズレベルがディジタル値で300〜4
00のとき、前者はこれより100高い400〜500
、後者はノイズレベルより200だけ高い500〜80
0とする。つまり、後端検出用レベル閾値のノイズレベ
ルとの差は、始端検出用レベル閾値のノイズレベルとの
差の2倍又はそれ以上とするとよい。
(発明の効果) 以上詳細に説明したように本発明によれば音声区間始端
検出に使用するレベル閾(aと音声区間終端検出に使用
するレベル閾値を別個に設定を行なう音声区間検出方式
としたので一般的に発声し易い呼吸音等の残留による音
声発声開始直前と音声発声終了直後における入力レベル
信号値の相違の影響を受けることなく正常に音声区間検
出を行なうことができ、音声認識装置における認識率の
向上が期待できる。
【図面の簡単な説明】
第1図は本発明に係る音声区間検出方式の実施例を示す
ブロック図、第2図は従来技術に係る音声区間検出方式
による実施例の説明図、第3図は本発明に係る音声区間
検出方式による実施例の説明図である。 (第3図の符合) LTH3;音声区間始端検出用レベル閾値、LTHE 
;音声区間終端検出用レベル閾値、TS;音声区間始端
決定高レベル 入力最低継続時間、 TE;音声区間終端決定低レベル 入力最低継続時間、

Claims (1)

    【特許請求の範囲】
  1. 音声信号を所定のレベル閾値と比較し、音声信号のレベ
    ルがレベル閾値より高い区間を音声区間として検出する
    音声区間検出方式において、音声区間の終端の検出のた
    めのレベル閾値が、音声区間の始端の検出のためのレベ
    ル閾値より高く設定されることを特徴とする音声区間検
    出方式。
JP59261738A 1984-12-13 1984-12-13 音声区間検出方式 Pending JPS61140999A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59261738A JPS61140999A (ja) 1984-12-13 1984-12-13 音声区間検出方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59261738A JPS61140999A (ja) 1984-12-13 1984-12-13 音声区間検出方式

Publications (1)

Publication Number Publication Date
JPS61140999A true JPS61140999A (ja) 1986-06-28

Family

ID=17366021

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59261738A Pending JPS61140999A (ja) 1984-12-13 1984-12-13 音声区間検出方式

Country Status (1)

Country Link
JP (1) JPS61140999A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63247798A (ja) * 1987-04-02 1988-10-14 富士通株式会社 音声区間検出装置
US6898258B2 (en) 2001-02-26 2005-05-24 Mitsubishi Heavy Industries, Ltd. Cask
JP2020076884A (ja) * 2018-11-08 2020-05-21 シャープ株式会社 冷蔵庫

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63247798A (ja) * 1987-04-02 1988-10-14 富士通株式会社 音声区間検出装置
US6898258B2 (en) 2001-02-26 2005-05-24 Mitsubishi Heavy Industries, Ltd. Cask
JP2020076884A (ja) * 2018-11-08 2020-05-21 シャープ株式会社 冷蔵庫

Similar Documents

Publication Publication Date Title
EP0077194B1 (en) Speech recognition system
JPH08185196A (ja) 音声区間検出装置
JPS61140999A (ja) 音声区間検出方式
JP2005331616A (ja) クライアント・サーバ音声認識方法、これに用いる装置、そのプログラム及び記録媒体
JPS61259296A (ja) 音声区間検出方式
JPS6242197A (ja) 音声区間検出方法
JPH0740200B2 (ja) 音声区間検出方法
JP2737109B2 (ja) 音声区間検出方式
JPH02103599A (ja) 音声認識装置
JPS607497A (ja) 音声認識装置
KR100322203B1 (ko) 차량의 음성인식장치 및 그 방법
JPS61292199A (ja) 音声認識装置
JPS6039691A (ja) 音声認識方法
JPS59231600A (ja) 音声区間検出方法
JPH02178699A (ja) 音声認識装置
JPH0376471B2 (ja)
JPH04240899A (ja) 音声認識装置
JPH07225592A (ja) 有音区間検出装置
JPH0546196A (ja) 音声認識装置
JPS5911920B2 (ja) 音声波形自動切り出し装置
JPH0394300A (ja) 音声検出器
JPH0567039B2 (ja)
JPH096380A (ja) 音声区間切り出し方式
JPS60205600A (ja) 音声認識装置
JPS59219797A (ja) 音声区間切り出し方式