JPS60498A - 音声検出装置 - Google Patents
音声検出装置Info
- Publication number
- JPS60498A JPS60498A JP58109006A JP10900683A JPS60498A JP S60498 A JPS60498 A JP S60498A JP 58109006 A JP58109006 A JP 58109006A JP 10900683 A JP10900683 A JP 10900683A JP S60498 A JPS60498 A JP S60498A
- Authority
- JP
- Japan
- Prior art keywords
- voice
- input
- contact
- signal
- register
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Geophysics And Detection Of Objects (AREA)
- Measuring Fluid Pressure (AREA)
- Burglar Alarm Systems (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔発明の技術分野〕
本発明は有音、無音の判定を行なう音声検出装置に関す
るものである。
るものである。
音声認識装置において、音声入力用マイクから入力され
た信号が認識対象の音声であるのかそれとも周囲の雑音
であるのかを識別することは極めて重要である。
た信号が認識対象の音声であるのかそれとも周囲の雑音
であるのかを識別することは極めて重要である。
この識別を行なうために、従来では音声検出装置に予め
しきい値を設定しておき、入力信号がこのしきい値より
大きい時は有音、小さい時は無音という判定を下してい
た。
しきい値を設定しておき、入力信号がこのしきい値より
大きい時は有音、小さい時は無音という判定を下してい
た。
しかしながら、この方法ではし・きい値が固定されてい
るために周一の雑音レベルがしきい値より大きくなった
場合、雑音が音声の始端だとみなされてしまい、誤動作
が多発するという欠点の他に。
るために周一の雑音レベルがしきい値より大きくなった
場合、雑音が音声の始端だとみなされてしまい、誤動作
が多発するという欠点の他に。
静かな環境で雑音レベルが小さい時にも音声として認識
されるためには設定されたしきい値よりも大きな音声信
号が入力されねばならず、不必要に大きな声で発声しな
ければならないという欠点をも有していた。
されるためには設定されたしきい値よりも大きな音声信
号が入力されねばならず、不必要に大きな声で発声しな
ければならないという欠点をも有していた。
本発明は上記欠点を解決するものであり、音声の始端検
出の精度を上げ、しかも周囲の雑音の大きい所では大き
な声で発声し、小さい所では小さな声で発声するという
人間の発声習性に合致した音声認識動作を可能にする音
声検出装置を提供することを目的とするものである。
出の精度を上げ、しかも周囲の雑音の大きい所では大き
な声で発声し、小さい所では小さな声で発声するという
人間の発声習性に合致した音声認識動作を可能にする音
声検出装置を提供することを目的とするものである。
そして上記目的は本発明によれば音声の始端・終端の検
出の行なう音声検出装置において、音声人力信号に先立
って周囲の雑音信号を選択入力する選択手段と、該雑音
信号のレベルによってしきい値の設定が更新されるしき
い値設定手段とを設けたことを特徴とする音声検出装置
を提供することによって達成される。
出の行なう音声検出装置において、音声人力信号に先立
って周囲の雑音信号を選択入力する選択手段と、該雑音
信号のレベルによってしきい値の設定が更新されるしき
い値設定手段とを設けたことを特徴とする音声検出装置
を提供することによって達成される。
以下本発明による音声検出装置の一実施例を図面を用い
て詳細に説明する。
て詳細に説明する。
第1図は本発明による音声検出装置を採用した −音声
認識装置全体の構成を示すブロック図である。
認識装置全体の構成を示すブロック図である。
音声入力部1から出力されたアナログ音声信号は、前処
理部2で帯域フィルタを通りアナログ・デジタル変換を
施されて、スイッチ3に達する。
理部2で帯域フィルタを通りアナログ・デジタル変換を
施されて、スイッチ3に達する。
スイッチ3は4図示されていない音声人力用マイクのオ
ン−オフ<0N−OFF)スイ・ソチを用し)るのが適
当であり、音声入力用マイクの0N−OFFスイッチが
OFFされている時はスイ・ノチ3の接片は接点Aと接
触し、ONされてし)る特番ま接点Bと接触するように
しておく。そうすれbi音声入力用マイクがOFF状態
の時は周囲の鴨音力く入力していることになり、ON状
態となることで音声が入力されるということになる。
ン−オフ<0N−OFF)スイ・ソチを用し)るのが適
当であり、音声入力用マイクの0N−OFFスイッチが
OFFされている時はスイ・ノチ3の接片は接点Aと接
触し、ONされてし)る特番ま接点Bと接触するように
しておく。そうすれbi音声入力用マイクがOFF状態
の時は周囲の鴨音力く入力していることになり、ON状
態となることで音声が入力されるということになる。
したがって雑音信号は前処理部2々・ら出力されると、
接点Aを通ってしきい値設定部4に入力する。しきい値
設定部4では、有音か無音力λを区男11するしきい値
が雑音レベルによって更新設定され。
接点Aを通ってしきい値設定部4に入力する。しきい値
設定部4では、有音か無音力λを区男11するしきい値
が雑音レベルによって更新設定され。
そのしきい値が始端・終端検出部5に出力される。
次に音声入力用マイクの0N−OFFスイスイチがON
されてスイ・ノチ3の接片が接点Inこ接触すると、今
度は周囲の雑音レベJしよりも太き(″I音声が入力さ
れて来る。この音声信号は、前処理部2から出力される
とスイ・ノチ3の接点Bを通って。
されてスイ・ノチ3の接片が接点Inこ接触すると、今
度は周囲の雑音レベJしよりも太き(″I音声が入力さ
れて来る。この音声信号は、前処理部2から出力される
とスイ・ノチ3の接点Bを通って。
始端・終端検出部5と特徴抽出部6へ入力する。
始端・終端検出部5では、しきい値設定部4カ・ら入力
されたしきい値と今回入力した音声信号とが比較され、
その結果として有音/無音フラグを特徴抽出部6へ出力
する。特徴抽出部6は5人力して来た信号が単なる雑音
であるか、認識対象となる音声であるかを有音/無音フ
ラグによって判断し、有音、すなわち認識対象音声であ
るならばその音声信号から特徴を抽出し、その抽出され
た特徴パターンと予め用意されている辞書パターンとが
認識部7でマツチング処理されて認識が成立することに
なる。
されたしきい値と今回入力した音声信号とが比較され、
その結果として有音/無音フラグを特徴抽出部6へ出力
する。特徴抽出部6は5人力して来た信号が単なる雑音
であるか、認識対象となる音声であるかを有音/無音フ
ラグによって判断し、有音、すなわち認識対象音声であ
るならばその音声信号から特徴を抽出し、その抽出され
た特徴パターンと予め用意されている辞書パターンとが
認識部7でマツチング処理されて認識が成立することに
なる。
次に第2図を用いて本発明の特徴となる音声検出装置に
ついて詳細に説明する。
ついて詳細に説明する。
音声検出装置は、第2図に示されるようにスイッチ3.
始端・終端検出部5.及びしきい値設定部4から構成さ
れている。しきい値設定部4は。
始端・終端検出部5.及びしきい値設定部4から構成さ
れている。しきい値設定部4は。
レジスタ8.RSフリップフロップ10.設定値メモリ
11.カウンタ13.設定値メモリ11の値とカウンタ
13の出力とを比較するコンパレータ12.そしてアン
ドゲート9,14によって構成されている。アンドゲー
ト14の入力Aはスイッチ3の接片が接点へに接触して
いるときにハイレベルとなり、接触していない時はロー
レベルである。またアンドゲート14に入力しているク
ロックφFは音声入力信号が一定時間間隔で切り出され
るクロックパルス信号である。またアンドゲート9とカ
ウンタ13にはクロックφFより短い周期のクロックφ
0が入力している。
11.カウンタ13.設定値メモリ11の値とカウンタ
13の出力とを比較するコンパレータ12.そしてアン
ドゲート9,14によって構成されている。アンドゲー
ト14の入力Aはスイッチ3の接片が接点へに接触して
いるときにハイレベルとなり、接触していない時はロー
レベルである。またアンドゲート14に入力しているク
ロックφFは音声入力信号が一定時間間隔で切り出され
るクロックパルス信号である。またアンドゲート9とカ
ウンタ13にはクロックφFより短い周期のクロックφ
0が入力している。
先ずスイッチ3の接片が接点Aに接触すると。
アンドゲート14の入力部がハイレベルとなる。
この状flでクロックφFがハイレベルとなった時。
アンドゲート14からの出力がレジスフ8.RSフリツ
プフロツプ10.そしてカウンタ13に入力する。 レ
ジスタ8はアンドゲート14からの信号によって前処理
部2からその時点での雑音信号をロードする。それと同
時にカウンタ13はクリアされ、RSフリンプフロソプ
10はりセントされてQの出力はハイレベルとなりアン
ドゲート9に入力する。RSフリップフロップ10は入
力S、Rの値がそれぞれハイレベル、ローレベルになら
ない限りセントされないから、コンパレータエ2から入
力Sに出力がない限りbの値はハイレベルであり続ける
。
プフロツプ10.そしてカウンタ13に入力する。 レ
ジスタ8はアンドゲート14からの信号によって前処理
部2からその時点での雑音信号をロードする。それと同
時にカウンタ13はクリアされ、RSフリンプフロソプ
10はりセントされてQの出力はハイレベルとなりアン
ドゲート9に入力する。RSフリップフロップ10は入
力S、Rの値がそれぞれハイレベル、ローレベルになら
ない限りセントされないから、コンパレータエ2から入
力Sに出力がない限りbの値はハイレベルであり続ける
。
本実施例ではレジスタ8にロートされた雑音信号に乗算
を施すことでしきい値を決定する方式が採用されている
が、その乗算する値は設定値メモリ11に予め格納され
ている。今仮にこの設定値をnとしておく。
を施すことでしきい値を決定する方式が採用されている
が、その乗算する値は設定値メモリ11に予め格納され
ている。今仮にこの設定値をnとしておく。
先ずクリアされたカウンタ13はクロックφ0によって
カウントを開始する。それと同じクロックφ0がアンド
ゲート9に入力する。カウンタ13の出力と設定値メモ
リ11に格納されている設定値nが一致しなければコン
パレータ12は出力せず、RSフリップフロップ1oの
出力bはハイレベルのままであるから、クロックφ0と
同じタイミングでアンドゲート9の出力パルスがレジス
タ8に与えられる。本実施例ではレジスタ8にシフトレ
ジスタを用いているのでアンドゲート9からのシフトパ
ルスを受ける毎にレジスタ8に格納されている雑音信号
を表わす各ビットが左ヘシフトし、その結果雑音信号レ
ベルが2倍、2′ 倍。
カウントを開始する。それと同じクロックφ0がアンド
ゲート9に入力する。カウンタ13の出力と設定値メモ
リ11に格納されている設定値nが一致しなければコン
パレータ12は出力せず、RSフリップフロップ1oの
出力bはハイレベルのままであるから、クロックφ0と
同じタイミングでアンドゲート9の出力パルスがレジス
タ8に与えられる。本実施例ではレジスタ8にシフトレ
ジスタを用いているのでアンドゲート9からのシフトパ
ルスを受ける毎にレジスタ8に格納されている雑音信号
を表わす各ビットが左ヘシフトし、その結果雑音信号レ
ベルが2倍、2′ 倍。
23 倍・・・と上昇することになる。この乗算はクロ
ックφ0のタイミングで行なわれる。
ックφ0のタイミングで行なわれる。
このようにしてカウント13がカウントを重ねて行き、
設定値メモリ11に格納されている設定値nに一致した
時、コンパレータ12はRSフリップフロップ10の入
力Sにハイレベルを出力する。ただしクロックφFによ
ってカウンタ13が一度クリアされているのでRSフリ
ップフロップ10の入力RとSとが同時にハイレベルに
なることはない。RSフリップフロップ10の入力Sが
ハイレベルとなることで出力Qはローレベルとなりアン
ドゲート9から一レジスタ8に与えられるシフトパルス
はf力士する。 以上のようにカウンタ13が設定値n
と一致するまでn回のシフトパルスがレジスタ8に与え
られたわけである。したがってレジスタ8にロードされ
た時点での雑音信号は2 倍され、しきい値としてレジ
スタ8に格納されていることになる。
設定値メモリ11に格納されている設定値nに一致した
時、コンパレータ12はRSフリップフロップ10の入
力Sにハイレベルを出力する。ただしクロックφFによ
ってカウンタ13が一度クリアされているのでRSフリ
ップフロップ10の入力RとSとが同時にハイレベルに
なることはない。RSフリップフロップ10の入力Sが
ハイレベルとなることで出力Qはローレベルとなりアン
ドゲート9から一レジスタ8に与えられるシフトパルス
はf力士する。 以上のようにカウンタ13が設定値n
と一致するまでn回のシフトパルスがレジスタ8に与え
られたわけである。したがってレジスタ8にロードされ
た時点での雑音信号は2 倍され、しきい値としてレジ
スタ8に格納されていることになる。
しかし次のクロックφF信号がアンドゲート14に入力
されると、アンドゲート14からの出力によってレジス
タ8には前処理部2からその時点での雑音信号がロード
され、その直前に格納されていた内容は消去されてしま
う。そしてこの新しい内容が上述したと同様に処理され
、更新されたしきい値としてレジスタ8に格納される。
されると、アンドゲート14からの出力によってレジス
タ8には前処理部2からその時点での雑音信号がロード
され、その直前に格納されていた内容は消去されてしま
う。そしてこの新しい内容が上述したと同様に処理され
、更新されたしきい値としてレジスタ8に格納される。
以後クロックφFのタイミングで同じ動作が繰り返され
、各時点で周囲の雑音レベルに適当なしきい値が設定さ
れることになる。
、各時点で周囲の雑音レベルに適当なしきい値が設定さ
れることになる。
そしである時点でスイッチ3の接片が接点Bに接触した
ならば、しきい値設定部4の動作は停止し、その時点で
レジスタ8に格納されている2”倍された雑音信号がし
きい値として始端・終端検出部5へ読み出され、前処理
部2から接点Bを通フて入力して来た音声信号と比較さ
れて、有音であるか無音であるかの決定がなされるわけ
である。
ならば、しきい値設定部4の動作は停止し、その時点で
レジスタ8に格納されている2”倍された雑音信号がし
きい値として始端・終端検出部5へ読み出され、前処理
部2から接点Bを通フて入力して来た音声信号と比較さ
れて、有音であるか無音であるかの決定がなされるわけ
である。
ただし本実施例では、レジスタ8にシフトレジスタを用
いて最も簡単な構成を示したが、シフトレジスタに限定
するものではなく1乗算器等を用いて細かいしきい値の
設定を行なうことも可能である。
いて最も簡単な構成を示したが、シフトレジスタに限定
するものではなく1乗算器等を用いて細かいしきい値の
設定を行なうことも可能である。
第3図は第2図に示した音声検出装置の処理全体の概略
的フローチャートである。判断S1はスイッチ3に対応
しており、スイッチ3の接片が接点Aに接触していれば
詳細に説明したしきい値更新処理S2すなわちしきい値
設定部4の処理を行ない、接点Bに接触していれば音声
認識処理S3すなわち始端、終端を検出して特徴抽出し
認識を行なう。
的フローチャートである。判断S1はスイッチ3に対応
しており、スイッチ3の接片が接点Aに接触していれば
詳細に説明したしきい値更新処理S2すなわちしきい値
設定部4の処理を行ない、接点Bに接触していれば音声
認識処理S3すなわち始端、終端を検出して特徴抽出し
認識を行なう。
以上詳細に説明したように本発明によれば1周囲゛り雑
音レベルによって音声検出のしきい値を更新することで
、音声認識において重要な音声の始端検出の精度を高め
、音声認識率を向上させるとともに9人間の発声習性に
従った発声で音声認識動作を行なうことができるという
効果大なるものである。
音レベルによって音声検出のしきい値を更新することで
、音声認識において重要な音声の始端検出の精度を高め
、音声認識率を向上させるとともに9人間の発声習性に
従った発声で音声認識動作を行なうことができるという
効果大なるものである。
第1図は音声認識装置全体の構成を示すブロック図、第
2図は音声検出装置の構成図、第3図は音声認識処理全
体の概略的フローチャートである。 1・・・音声入力部、 2・・・前処理部。 3・・・スイッチ、 4・・・しきい値設定部。 5・・・始端・終端検出部、 8・・・レジスタ、 1
0・・・RSフリップフロップ。 13・・・カウンタ 特許出願人 カシオ針算機株式会社 代理人弁理士 大 菅 義 之 第2図 4 第3図
2図は音声検出装置の構成図、第3図は音声認識処理全
体の概略的フローチャートである。 1・・・音声入力部、 2・・・前処理部。 3・・・スイッチ、 4・・・しきい値設定部。 5・・・始端・終端検出部、 8・・・レジスタ、 1
0・・・RSフリップフロップ。 13・・・カウンタ 特許出願人 カシオ針算機株式会社 代理人弁理士 大 菅 義 之 第2図 4 第3図
Claims (2)
- (1) 音声の始端・終端の検出を行なう音、声検出装
置において、音声入力信号に先立って周囲の雑音信号を
選択入力する選択手段と、該雑音信号のレベルによって
しきい値の設定が更新されるしきい値設定手段とを設け
たことを特徴とする音声検出装置。 - (2) 上記選択手段は音声入力用マイクに設けられた
手動式二接点スイッチを用いたことを特徴とする特許請
求の範囲第1項記載の音声検出装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP58109006A JPS60498A (ja) | 1983-06-17 | 1983-06-17 | 音声検出装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP58109006A JPS60498A (ja) | 1983-06-17 | 1983-06-17 | 音声検出装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS60498A true JPS60498A (ja) | 1985-01-05 |
Family
ID=14499175
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP58109006A Pending JPS60498A (ja) | 1983-06-17 | 1983-06-17 | 音声検出装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS60498A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS63243998A (ja) * | 1987-03-31 | 1988-10-11 | カシオ計算機株式会社 | 電子楽器の入力制御装置 |
WO1998041978A1 (fr) * | 1997-03-19 | 1998-09-24 | Hitachi, Ltd. | Procede et dispositif destines a detecter des points de depart et de terminaison d'une section son dans une sequence video |
-
1983
- 1983-06-17 JP JP58109006A patent/JPS60498A/ja active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS63243998A (ja) * | 1987-03-31 | 1988-10-11 | カシオ計算機株式会社 | 電子楽器の入力制御装置 |
WO1998041978A1 (fr) * | 1997-03-19 | 1998-09-24 | Hitachi, Ltd. | Procede et dispositif destines a detecter des points de depart et de terminaison d'une section son dans une sequence video |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP0077194B1 (en) | Speech recognition system | |
JPS60498A (ja) | 音声検出装置 | |
JP2996019B2 (ja) | 音声認識装置 | |
JPS62150295A (ja) | 音声認識方法 | |
JPH0950288A (ja) | 音声認識装置及び音声認識方法 | |
JPS6267598A (ja) | 音声区間検出方式 | |
JPS60499A (ja) | 音声認識装置におけるしきい値設定方式 | |
JP3360978B2 (ja) | 音声認識装置 | |
JP2656234B2 (ja) | 会話音声理解方法 | |
JPS61260299A (ja) | 音声認識装置 | |
JPH02103599A (ja) | 音声認識装置 | |
JP3031081B2 (ja) | 音声認識装置 | |
JPH0562756B2 (ja) | ||
JPS60104999A (ja) | 音声認識装置 | |
JPH0262879B2 (ja) | ||
JPS6326879Y2 (ja) | ||
JP2891259B2 (ja) | 音声区間検出装置 | |
JPS6193499A (ja) | 音声パタ−ン照合方式 | |
JPH0546196A (ja) | 音声認識装置 | |
JPS60170900A (ja) | 音節音声標準パタン登録方式 | |
JPS59180594A (ja) | 音声認識装置 | |
JPS61246800A (ja) | 音声応答スイツチ | |
JPH01116596A (ja) | 音声検出装置 | |
JPS6063900U (ja) | 音声認識装置 | |
JPH04240899A (ja) | 音声認識装置 |