JPS6247319B2 - - Google Patents

Info

Publication number
JPS6247319B2
JPS6247319B2 JP57072591A JP7259182A JPS6247319B2 JP S6247319 B2 JPS6247319 B2 JP S6247319B2 JP 57072591 A JP57072591 A JP 57072591A JP 7259182 A JP7259182 A JP 7259182A JP S6247319 B2 JPS6247319 B2 JP S6247319B2
Authority
JP
Japan
Prior art keywords
sound information
threshold value
time
voice
level
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP57072591A
Other languages
English (en)
Other versions
JPS58190993A (ja
Inventor
Kazunori Noso
Norimasa Kishi
Tooru Futami
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nissan Motor Co Ltd
Original Assignee
Nissan Motor Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nissan Motor Co Ltd filed Critical Nissan Motor Co Ltd
Priority to JP57072591A priority Critical patent/JPS58190993A/ja
Priority to US06/428,233 priority patent/US4531228A/en
Priority to EP82109698A priority patent/EP0077574B1/en
Priority to DE8282109698T priority patent/DE3273477D1/de
Publication of JPS58190993A publication Critical patent/JPS58190993A/ja
Publication of JPS6247319B2 publication Critical patent/JPS6247319B2/ja
Granted legal-status Critical Current

Links

Description

【発明の詳細な説明】 本発明は音声の終端検出を確実にした車両用音
声検出装置に関する。
最近、音声で指令や情報を入力するとその音声
を認識しその指令や情報の内容を判別する音声認
識装置が多くの産業分野で実用化されており、車
両への応用も検討されいる。第1図はこのような
音声認識装置のブロツク線図で、そのうち音声検
出装置を破線で示してある。騒音と音声指令とか
ら成る音情報がマイクロホン1に入力すると、増
幅部2において増幅され、第2図イに示すような
音情報信号が音声認識部3および整流部4に供給
される。整流部4に供給された音情報信号は、第
2図ロに実線で示すように、整流部4および第1
の平滑部5において整流および20msec〜30msec
程度の時定数で平滑処理され比較部6に印加され
る。一方、整流部4で整流された音情報信号は、
第2図ロに破線で示すように、第2の平滑部7に
おいて100msec〜2000msec程度の時定数で平滑
処理された後増幅部8で増幅されて閾値として比
較部6に印加される。比較部6では第1の平滑部
5で平滑処理された音情報信号と増幅部8で増幅
された閾値とが比較され、第2図ハに示すような
音声検出信号が判断部9に供給される。
判断部9においては、まず音声指令の始端を検
出するために、この音声検出信号について、時間
t1,t2およびt3を音声の始端判定の基準時間tS
比較し、その結果時間t1についてはt1<tSである
ので音声指令の始端とは判定せず、時間t2につい
てはt2>tSであるので音声指令の始端と判定
し、第2図ニに記号PSで示される本来の音声指
令の始端より上記基準時間tSだけ遅れて音声認
識部3への出力信号をハイレベル“H”にして
(第4図ニ参照)音声指令の終端の検出に移る。
次に、判断部9では、音声指令の終端を検出する
ため、上記音情報信号が閾値よりも小さい状態を
示す時間t4およびt5を音声指令の終端判定の基準
時間tEと比較し、その結果時間t4についてはt4
Eであるので音声指令の終端とは判定せず、時
間t5についてはt5>tEであるので音声指令の終端
と判定し、記号PEで示される本来の音声指令の
終端より上記基準時間tEだけ遅れて、音声認識
部3への出力信号をローレベル“L”とする(第
2図ニ参照)。
こうして、音声認識部3においては、判断部9
から出力される音声指令の終端および終端を示す
信号PSおよびPE(第2図ニ参照)に基づき先に
増幅部2から供給された音情報信号からフイルタ
分折などにより特徴パラメータを抽出することに
よつて認識する。
ところで、上記音声検出装置においては、音声
指令の始端および終端の検出を行なうのに第1の
平滑部で平滑処理した音情報信号のレベルを第2
の平滑部で音情報信号を平滑処理して作つた閾値
と比較し、前者が後者を上回つたときを音声指令
の始端とし、下回つたときを音声指令の終端とし
ているが、音声指令の入力中にたとえばトンネル
に入つた場合のように騒音レベルが急激に高くな
ると閾値の方が音情報信号のレベルより大きくな
つてしまい音声指令の終端検出ができなくなると
いう問題がある。
本発明は上記の点にかんがみてなされたもの
で、音情報のレベルをその音情報レベルに基づい
て定めた閾値と比較し、音情報レベルが閾値を上
回つたときを音声指令の始端、下回つたときを音
声指令の終端として検出する音声検出装置におい
て、始端検出後、大きな騒音があつても終端検出
でできるようにするため、始端検出後所定時間経
過しても終端検出できないときは閾値をより大き
な値に補正し、再検出するようにしたものであ
る。
以下本発明を図面に基づいて説明する。
第3図は本発明による音声検出装置の一実施例
のブロツク線図を示しており、10は音声指令を
入力するマイクロホン、11はマイクロホン10
から入力される音声指令および騒音から成る音情
報のレベルを検出するレベル検出部、12はレベ
ル検出部11から出力されるレベル信号に基づい
て閾値を演算する閾値演算部、13はレベル検出
部11からのレベル信号と閾値演算部12により
演算された閾値との大小を比較し音声指令の始端
を検出する比較判断部、14は比較判断部13に
より音声指令の始端が検出されたときから予め定
めた時間Tを計測するタイマー、15はOR回
路、16は音声指令の始端が検出されたときまた
はタイマー14が出力している間レベル検出部1
1からの音情報データすなわちレベル信号を順次
格納するとともにタイマー14の設定時間Tの経
過後それまで格納されたレベル信号を新しい順
(すなわち後から格納された順)に読み出すメモ
リ部で、このメモリ部16の記憶容量はタイマー
14の設定時間Tよりは大きく選んであり、約1
〜2秒である。17は閾値演算部12により演算
された閾値を補正する閾値補正部で、閾値の補正
は閾値演算部12により演算された閾値を所定倍
するかまたは始端検出時の閾値に始端検出より時
間T経過したときのレベル信号を加えて行なつて
もよい。18はメモリ部16から読み出されたレ
ベル信号を閾値補正部17から出力される閾値と
比較し音声指令の終端を判断する比較判断部であ
る。
上記音声検出装置は、音声指令を入力するマイ
クロホンと、マイクロホンからの音情報信号を増
幅する増幅器と、所定のプログラムで動作するマ
イクロコンピユータとにより実現することもで
き、そのように実現した装置の動作を第4図イお
よびロに示したフローチヤートおよび第5図、第
6図に示したタイムチヤートを用いて以下に説明
する。
説明に先立ち、以下の音声の始端検出動作の説
明に用いられる符号とその内容を列記する。
n:時間を表わす添字 E:音声の始端検出時における閾値 Eo:音情報取込み時における閾値 So:音情報のレベル(≧0) M1:取込んだ音声データの区間数 M2:So<Eとなる区間数 M3:“1”のときは音声の始端検出の完了
“0”のときは音声の始端検出の未完了 L:タイマーの設定時間T内に取込まれる音情
報データの数 w1:時間τに対応するカウント数 w2:時間τに対応するカウント数 初めに、ステツプ100,101,102に示
すように、nを0から順次増すとともに初期状態
としてM1,M2,M3を0にする。またステツプ1
03で閾値EをEoに置き換える。
ある時点nにおいて、音情報を入力し(ステツ
プ104)、一方、その音情報入力時における閾
値Eoをたとえば次式により演算する(ステツプ
105)。
次にその音情報レベルSoを閾値E(=Eo)と
比較し(ステツプ106)、So<Eで且つM3
0か否かすなわち始端検出が完了したか否かを判
断し(ステツプ107)まだ完了していなければ
同じ動作を繰り返す。この場合、閾値Eは上式で
演算した閾値Eoと置き換える。その後So≧Eと
なれば、区間数M1を1とし(ステツプ108)、
そのM1すなわち1を予め定めた時間τに対応
したカウントw1(たとえばサンプリング時間を
9ミリ秒としτを72ミリ秒とすると、カウント
w1は8となる)と比較判定する(ステツプ10
9)。このときより音情報のデータ(音情報レベ
ルSo)をメモリ部16にレベルデータxnとして
格納する(ステツプ112)。もし、M1>w1とな
る前にSo<Eとなつたとき(たとえば短時間の
ノイズなどが入つた場合)はM3=0となるため
に最初にもどつて動作を繰り返す。このときもち
ろん閾値EはEoで置き換える。
M1>w1となれば音声の始端検出が完了しM3
1とするとともにM2=0とする(ステツプ11
0)。一旦M1>w1となればM3=1となるため
に、その後So<Eとなることがあつても音情報
のデータはメモリ部16へ格納され続ける。
再びステツプ106にもどり、So<Eで且つ
M3=1すなわち始端検出が完了したときはM1
よびM2を増分していく(ステツプ111)。この
とき音情報データのメモリ部16への格納は続け
られる。その後、M2が増分するにつれてM2が予
じめ定めた時間τに対応したカウント値w2
(たとえば40)より大きいか小さいかを判別し
(ステツプ113)、M2>w2となつたとき音情報
データの入力を打ち切り次の始端検出ステツプ
(すなわち第4図ロに示すステツプ116)へ進
む。また、M2<w1のときは、nを順次増しM1
タイマー14による設定時間T内に取込まれた音
情報データの数Lを越えたとき音情報データの入
力を打ち切る。M1がL以下の場合はステツプ1
04にもどつて同じ動作を繰り返す。
次に音声の終端検出について第4図ロを用いて
説明する。以下の説明において用いられる符号と
その内容は次のとおりである。
r:時間を表わす添字 m:終端検出時のメモリの番地でm=M1−r
で表わされる v:閾値を連続して越えた音情報データの数 xn:メモリ部から読み出された音情報データ
(レベル) w3:時間τに対応するカウント数 さて、音声の終端検出に当つては、まず、初期
状態としてrとvを0とする(ステツプ11
6)。次に、取込まれた音情報データの区間数M1
がLに等しいか否かを判別し(ステツプ11
7)、等しければすなわちタイマー14による設
定時間Tが経過したときは閾値EをたとえばE+
L(ここでEは始端検出時の閾値でありSLは最
終取込み時の音情報レベルである)で置き換える
(ステツプ118)。これは第3図に示した実施例
では閾値補正部17による閾値補正である。なお
閾値の補正は、このほかに、タイマー14による
設定時間T経過時の音情報データにより定まる閾
値ELで置き換えるか、始端検出時の閾値に定数
を加えたもので置き換えて行なつてもよい。次
に、メモリ部16の番地mに格納されている音情
報データxnを順次読み出し(ステツプ119)、
すでに置き換えた閾値E′すなわち(E+SL)と
比較する(ステツプ120)。その結果、xn
E′ならば、rおよびvを増分していき(ステツ
プ121)、xn<E′ならばrは増分していくが
vは0とする(ステツプ122)。もし閾値E′を
連続して越えた音情報データの数vは予じめ定め
た時間τに対応した数w3(たとえば8)を越
えれば終端が検出されたことになり(ステツプ1
23)、このときの音声長はM1−v+w3となる
(ステツプ124)、なお、始端はメモリの先頭と
一致し、終端はM1−v+w3に対応する番地とな
る。
第7図は本発明による音声認識装置の他の実施
例を示し、第3図と同じ参照数字は同じ構成部分
を示す。
この実施例はタイマー14の出力を用いずに閾
値を補正するものであり、音声指令の長さ判断部
19を設け、比較判断部13から出力される始端
結果と比較判断部18から出力される終端結果と
から音声指令の長さを計算し、その長さがある一
定時間(たとえば約1秒)より長いときは閾値補
正部17に補正信号を出力し閾値を増すように補
正する。長さ判断部19は同時にメモリ部16に
も信号を出力し、再度終端検出を開始する。2回
目の終端検出時には、閾値が大きくなつているの
で音声指令の長さはより短くなる。
次に再び第4図ロを参照して第7図に示した実
施例の終端検出動作だけを説明する。
第4図ロにおいて、閾値を連続して越えた音情
報データの数vがw3を越えたときの音声長はM1
−v+w3となるが(ステツプ124)、この音声
長M1−v+w3が予め定めた長さN(たとえば約
1.2秒)より長いか否かを判定し(ステツプ12
5)、長いときはrおよびvを0として閾値を増
して(ステツプ118)終端検出を再度行なう
(ステツプ126)。音声長M1−v+w3が所定長
Nより短いときは終端検出を終了する。
以上説明したように、本発明は、音情報のレベ
ルをその音情報レベルに基づいて演算した閾値と
比較し、音情報レベルが閾値を上回つたときを音
声指令の始端、下回つたときを音声指令の終端と
して検出する音声検出装置において、始端検出後
所定時間経過しても終端検出ができないときは、
終端検出の閾値をより大きな値に補正するように
したので、音声指令の入力中に騒音レベルが増加
したときでも音声の終端検出ができる。さらに、
終端検出時の閾値を音声指令入力後の信号レベル
によつて計算するため、終端検出の精度も向上す
る。
【図面の簡単な説明】
第1図は従来の音声検出装置のブロツク線図、
第2図は第1図に示した音声検出装置の各部にお
ける信号波形のタイムチヤート、第3図は本発明
による音声検出装置の一実施例のブロツク線図、
第4図イおよびロは第3図に示した音声検出装置
の動作を示すフローチヤート、第5図および第6
図は本発明による音声の始端および終端の検出を
説明する図、第7図は本発明による音声検出装置
の他の実施例のブロツク線図である。 1,10……マイクロホン、2,8……増幅
部、3……音声認識部、4……整流部、5,7…
…平滑部、6……比較部、9……判断部、11…
…レベル検出部、12……閾値演算部、13,1
8……比較判断部、14……タイマー、15……
OR回路、16……メモリ部、17……閾値補正
部、19……長さ判断部。

Claims (1)

    【特許請求の範囲】
  1. 1 音情報のレベルがその音情報レベルに基づい
    て定められる閾値を上回つたとき音声指令の始端
    として検出する始端検出手段と、前記始端検出
    後、前記音情報レベルがその音情報レベルに基づ
    いて定められた閾値を下つたとき音声指令の終端
    として検出する終端検出手段と、少なくとも前記
    始端検出後、所定時間は前記音情報レベルを記憶
    する記憶手段と、前記所定時間経過するまでに前
    記終端検出されないとき、前記終端検出の閾値を
    所定値上昇させた後、前記記憶された音情報レベ
    ルを呼び出し終端を再検出する再検出手段とを有
    することを特徴とする車両用音声検出装置。
JP57072591A 1981-10-20 1982-05-01 車両用音声検出装置 Granted JPS58190993A (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP57072591A JPS58190993A (ja) 1982-05-01 1982-05-01 車両用音声検出装置
US06/428,233 US4531228A (en) 1981-10-20 1982-09-29 Speech recognition system for an automotive vehicle
EP82109698A EP0077574B1 (en) 1981-10-20 1982-10-20 Speech recognition system for an automotive vehicle
DE8282109698T DE3273477D1 (en) 1981-10-20 1982-10-20 Speech recognition system for an automotive vehicle

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57072591A JPS58190993A (ja) 1982-05-01 1982-05-01 車両用音声検出装置

Publications (2)

Publication Number Publication Date
JPS58190993A JPS58190993A (ja) 1983-11-08
JPS6247319B2 true JPS6247319B2 (ja) 1987-10-07

Family

ID=13493786

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57072591A Granted JPS58190993A (ja) 1981-10-20 1982-05-01 車両用音声検出装置

Country Status (1)

Country Link
JP (1) JPS58190993A (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61116400A (ja) * 1984-11-12 1986-06-03 シャープ株式会社 音声情報処理装置
JPH0792672B2 (ja) * 1986-04-10 1995-10-09 株式会社リコー 音声区間検出方法
JP5863928B1 (ja) * 2014-10-29 2016-02-17 シャープ株式会社 音声調整装置

Also Published As

Publication number Publication date
JPS58190993A (ja) 1983-11-08

Similar Documents

Publication Publication Date Title
US4531228A (en) Speech recognition system for an automotive vehicle
JPS5852695A (ja) 車両用音声検出装置
JP3604393B2 (ja) 音声検出装置
US5617508A (en) Speech detection device for the detection of speech end points based on variance of frequency band limited energy
US5579431A (en) Speech detection in presence of noise by determining variance over time of frequency band limited energy
JPS6250839B2 (ja)
JPH09325790A (ja) 音声処理方法および装置
JPS6329754B2 (ja)
JPS6247319B2 (ja)
JP2000310993A (ja) 音声検出装置
JPH0138320B2 (ja)
JP3822534B2 (ja) 応答制御装置、方法及び応答制御プログラム、記録媒体
JPS6147437B2 (ja)
JPH1195785A (ja) 音声区間検出方式
JP3360978B2 (ja) 音声認識装置
JP2754960B2 (ja) 音声認識装置
JP2737109B2 (ja) 音声区間検出方式
JPS62237498A (ja) 音声区間検出方法
JP3484559B2 (ja) 音声認識装置および音声認識方法
JP3299574B2 (ja) 認識装置
JP3237350B2 (ja) 自動利得制御装置
JPS62141595A (ja) 音声検出方式
JPH0588839B2 (ja)
JPH0651792A (ja) 音声認識装置
JP2901976B2 (ja) パターン照合予備選択方式