JPS60191299A - 音声認識装置における音声区間検出方式 - Google Patents
音声認識装置における音声区間検出方式Info
- Publication number
- JPS60191299A JPS60191299A JP59047939A JP4793984A JPS60191299A JP S60191299 A JPS60191299 A JP S60191299A JP 59047939 A JP59047939 A JP 59047939A JP 4793984 A JP4793984 A JP 4793984A JP S60191299 A JPS60191299 A JP S60191299A
- Authority
- JP
- Japan
- Prior art keywords
- signal
- silent
- word
- section
- voice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
皮五上1
本発明は、音声認識装置における音声区間検出方式に関
する。
する。
Lu」
従来の音声認識装置においては、入力音声パワーがある
一定レベルを越えた時のみを単純に音声区間としていた
ため、促音などによって生じる無音区間の中で短いもの
も長いものもすべて一つの無音区間として扱わざるを得
なかった。そのため、l単語間のブロック数が増加し辞
書データが増加する欠点があった。
一定レベルを越えた時のみを単純に音声区間としていた
ため、促音などによって生じる無音区間の中で短いもの
も長いものもすべて一つの無音区間として扱わざるを得
なかった。そのため、l単語間のブロック数が増加し辞
書データが増加する欠点があった。
止−−1
本発明は、上述のごとき実情に鑑みてなされたもので、
特に、音声認識装置において使用する音声区間検出方式
、より詳細には、任意に設定された無音区間以下のもの
は無視し、設定値以上のものを無音区間とし、単語のイ
J声区間を自動的にブロック化して信号を発生し、同様
にして設定された休止区間以上のもののみ単語の終端と
して扱う区間信号を発生する音声区間検出方式を提供す
ることを目的としてなされたものである。
特に、音声認識装置において使用する音声区間検出方式
、より詳細には、任意に設定された無音区間以下のもの
は無視し、設定値以上のものを無音区間とし、単語のイ
J声区間を自動的にブロック化して信号を発生し、同様
にして設定された休止区間以上のもののみ単語の終端と
して扱う区間信号を発生する音声区間検出方式を提供す
ることを目的としてなされたものである。
構−一一一成
本発明の構成について、以下、実施例に基づいて説明す
る。
る。
第1図は、本発明による音声区間検出方式の全体構成を
示すブロック線図で、図中、lはバンドパスフィルタ(
B、P、F)、2は包絡線検波回路、3はローパスフィ
ルタ(L、P、F)、4はコンパレータ、5は音声区間
検出回路で、人力された音声信号(INPUT)は、B
、P、Fを通して不要な帯域か削除されたあと包絡線検
波され、L、P、Fを通して音声パワー信号にされ、コ
ンパレータを通してデジタル有声区間信号■が検出され
、音声区間検出回路にて単語内ブロック区間信号■とl
単語区間信号■を得る。この単語内ブロック信号■は単
語内辞書のブロック信号となる訳であるが、任意に設定
できる無音区間設定時間幅を持っていれば、必要以上の
ブロック化がなくなり認識率を向上させる事ができる。
示すブロック線図で、図中、lはバンドパスフィルタ(
B、P、F)、2は包絡線検波回路、3はローパスフィ
ルタ(L、P、F)、4はコンパレータ、5は音声区間
検出回路で、人力された音声信号(INPUT)は、B
、P、Fを通して不要な帯域か削除されたあと包絡線検
波され、L、P、Fを通して音声パワー信号にされ、コ
ンパレータを通してデジタル有声区間信号■が検出され
、音声区間検出回路にて単語内ブロック区間信号■とl
単語区間信号■を得る。この単語内ブロック信号■は単
語内辞書のブロック信号となる訳であるが、任意に設定
できる無音区間設定時間幅を持っていれば、必要以上の
ブロック化がなくなり認識率を向上させる事ができる。
第2図は、第1図に示した音声区間検出回路5をカウン
ト方式を用いて実現した場合の一例を示す図、第3図は
、その動作説明をするだめのタイムチャートで、図中、
11は立ち上りエツジ検出回路、12は2デジット同期
カウンタ、13は同期発振器、14.15はデジタル比
較器、16は無音設定スイッチ(8ビツト)、17は休
止設定スイッチ、18は無音り型フリップフロップ、1
9は休止り型フリップフロップで、各部の信号波形は第
3図′に示す通りである。以下に、無音区間をloom
s、休止区間を350 m sに設定し、第3図のa、
b、’cがa<Looms 、100m5<b<350
m5.350m5<cのパルス幅を持っているものとし
て説明する。前段より入力されたデジタル有声区間信号
■は立ち−Lがり検出回路11において立ち上がりエツ
ジパルス■を発生すると共に、デジタル有声区間信号■
の反転パルスが2デジツト(8’bit)同期カウンタ
12のクリア端子に入力され、該信号(pのHi gh
区間は必ずクリアされ無音区間はクロックのカウント状
態となる。なお、クロックはl Oms周期のものを用
いている。次に無音設定スイッチ16と休止設定スイッ
チ17で無音区間及び休止区間が設定され、同期カウン
タ12のカラントノぐラムル出力と各々のデジタル比較
器14.15で比較され 一致するとLowアクティブ
な一致パルス・、印、・III)か発生され、各々のD
型フリップフロップ18.19のクリア端子に接続され
る。第3図の例においては、立ち上がりエツジパルス(
■によって各々のD型フリップフロップ18.19はラ
ッチされ無音区間の場合は無音一致パルス■によりクリ
アされるまで有声区間とされる。無音一致パルスはす、
cにおいて発生されるので(艷のように2つにブロック
化された単語内ブロック信号が得られる。又、休止区間
の場合も同様に体IL一致パルス(4)によりクリアさ
れるまで一巾語区間とされ単語が終了して350 m
s後に1単語区間信号(Φが11jられ、そのカウント
が終了すると、カウンタのEnable端子はDisE
nableとなり、次の単語が人力されるのを待つ。上
述のごとくして、単語内ブロック信号と1単語区間信号
が祠られるが、単語内ブロック区間信号には無音設定区
間分、■単語区間信号には休止設定区間分だけ時間幅が
広がっているが、これは認識装置の辞書構成時、削除す
れば良いのでさほど問題とならない。第4図は、第1図
に示した音声区間検出回路5をモノマルチ方式を用いて
実現した場合の一例を示す図、第5図は、その動作説明
をするためのタイムチャートで、図中、21は立ち上り
エツジ検出同温、22は無音モノマルチ、23は休止モ
ノマルチ、24は立ち上りエツジ検出回路、25.26
は論理積回路、27は論理和回路、28は無音り型フリ
ップフロップ回路で、各部の信号波形は第5図に示す通
りである。この第4図及び第5図に示した実施例におい
て、無音区間、休止区間及びa、b、cを第2図及び第
3図に示した実施例と同様にして設定する。前段より入
力されたデジタル有声区間信号■は、立ち」ニリエツジ
検出回路21を駆動して立ち上りエツジパルス■を発生
するとともに、デジタル或いはアナログ方式の無音、休
止モノマルチ22及び23を駆動して、その立ち上がり
エツジにより無音幅、休止幅パルス■、■を発生させる
。ここで、有声区間信号僧)と無音幅パルス■の論理積
を論理積回路25によってとって無音り型フリップフロ
ップのクロック信号量)とし、これにより設定無音区間
以下の無音区間の立ち上がりエツジパルスを削除する。
ト方式を用いて実現した場合の一例を示す図、第3図は
、その動作説明をするだめのタイムチャートで、図中、
11は立ち上りエツジ検出回路、12は2デジット同期
カウンタ、13は同期発振器、14.15はデジタル比
較器、16は無音設定スイッチ(8ビツト)、17は休
止設定スイッチ、18は無音り型フリップフロップ、1
9は休止り型フリップフロップで、各部の信号波形は第
3図′に示す通りである。以下に、無音区間をloom
s、休止区間を350 m sに設定し、第3図のa、
b、’cがa<Looms 、100m5<b<350
m5.350m5<cのパルス幅を持っているものとし
て説明する。前段より入力されたデジタル有声区間信号
■は立ち−Lがり検出回路11において立ち上がりエツ
ジパルス■を発生すると共に、デジタル有声区間信号■
の反転パルスが2デジツト(8’bit)同期カウンタ
12のクリア端子に入力され、該信号(pのHi gh
区間は必ずクリアされ無音区間はクロックのカウント状
態となる。なお、クロックはl Oms周期のものを用
いている。次に無音設定スイッチ16と休止設定スイッ
チ17で無音区間及び休止区間が設定され、同期カウン
タ12のカラントノぐラムル出力と各々のデジタル比較
器14.15で比較され 一致するとLowアクティブ
な一致パルス・、印、・III)か発生され、各々のD
型フリップフロップ18.19のクリア端子に接続され
る。第3図の例においては、立ち上がりエツジパルス(
■によって各々のD型フリップフロップ18.19はラ
ッチされ無音区間の場合は無音一致パルス■によりクリ
アされるまで有声区間とされる。無音一致パルスはす、
cにおいて発生されるので(艷のように2つにブロック
化された単語内ブロック信号が得られる。又、休止区間
の場合も同様に体IL一致パルス(4)によりクリアさ
れるまで一巾語区間とされ単語が終了して350 m
s後に1単語区間信号(Φが11jられ、そのカウント
が終了すると、カウンタのEnable端子はDisE
nableとなり、次の単語が人力されるのを待つ。上
述のごとくして、単語内ブロック信号と1単語区間信号
が祠られるが、単語内ブロック区間信号には無音設定区
間分、■単語区間信号には休止設定区間分だけ時間幅が
広がっているが、これは認識装置の辞書構成時、削除す
れば良いのでさほど問題とならない。第4図は、第1図
に示した音声区間検出回路5をモノマルチ方式を用いて
実現した場合の一例を示す図、第5図は、その動作説明
をするためのタイムチャートで、図中、21は立ち上り
エツジ検出同温、22は無音モノマルチ、23は休止モ
ノマルチ、24は立ち上りエツジ検出回路、25.26
は論理積回路、27は論理和回路、28は無音り型フリ
ップフロップ回路で、各部の信号波形は第5図に示す通
りである。この第4図及び第5図に示した実施例におい
て、無音区間、休止区間及びa、b、cを第2図及び第
3図に示した実施例と同様にして設定する。前段より入
力されたデジタル有声区間信号■は、立ち」ニリエツジ
検出回路21を駆動して立ち上りエツジパルス■を発生
するとともに、デジタル或いはアナログ方式の無音、休
止モノマルチ22及び23を駆動して、その立ち上がり
エツジにより無音幅、休止幅パルス■、■を発生させる
。ここで、有声区間信号僧)と無音幅パルス■の論理積
を論理積回路25によってとって無音り型フリップフロ
ップのクロック信号量)とし、これにより設定無音区間
以下の無音区間の立ち上がりエツジパルスを削除する。
次に、先の無音幅パルス■の立ち上りエツジパルスと反
転された有声区間信号との論理積を論理積回路26によ
ってとると無音区間の終端信号■となり、これを無音り
型フリップフロップのクリア端子に供給することにより
単語内ブロック信号■が得られる。更に、先の休止幅パ
ルス(4)と有声区間信号との論理和を論理和回路27
によってとると1単語区間信号(肴)が得られる。
転された有声区間信号との論理積を論理積回路26によ
ってとると無音区間の終端信号■となり、これを無音り
型フリップフロップのクリア端子に供給することにより
単語内ブロック信号■が得られる。更に、先の休止幅パ
ルス(4)と有声区間信号との論理和を論理和回路27
によってとると1単語区間信号(肴)が得られる。
この様にして先のカウント方式と同様の単語内ブロック
信号と1単語区間信−号が得られる。
信号と1単語区間信−号が得られる。
と、
(1)単語内ブロック区間信号が得られ、辞書のブロッ
ク化が自動的に行われ、処理時間の高速化を9−(るこ
とができる。
ク化が自動的に行われ、処理時間の高速化を9−(るこ
とができる。
(2)任意の時間幅以下の無音区間が発生しても無視で
き、必要以上のブロック化が行われない。
き、必要以上のブロック化が行われない。
(3)任意の休止区間による単語単位の認識が可能とな
る。
る。
等の利点がある。
第1図は、本発明の一実施例を説明するための全体回路
構成図、第2図は、第1図に示した音声区間検出回路の
一例を示す詳細図、i3図は、第2図の回路の動作説明
をするためのタイムチャート、第4図は、第1図に示し
た音声区間検出回路の他の例を示す詳細図、第5図は、
第4図の回路の動作説明をするためのタイムチャートで
ある。 1・・・バンドパスフィルタ、2・・・包絡線検波回路
、3・・・ローハスフィルタ、4・・・コンパレータ、
5・・・音声区間検出回路。 第1図 :22図 ■ 第4図 IN PU T の
構成図、第2図は、第1図に示した音声区間検出回路の
一例を示す詳細図、i3図は、第2図の回路の動作説明
をするためのタイムチャート、第4図は、第1図に示し
た音声区間検出回路の他の例を示す詳細図、第5図は、
第4図の回路の動作説明をするためのタイムチャートで
ある。 1・・・バンドパスフィルタ、2・・・包絡線検波回路
、3・・・ローハスフィルタ、4・・・コンパレータ、
5・・・音声区間検出回路。 第1図 :22図 ■ 第4図 IN PU T の
Claims (1)
- 【特許請求の範囲】 単語音声認識装置において、音声信号をB。 P、Fにおいて不要な帯域を除いた後、その包絡線検波
を行いり、P、Fで音声パワーに変換しコンパレータを
通して得られるようなデジタル看声区間信号を用いて促
音などによって生じる無音区間を任意な設定値以下の区
間に関しては連続有声凶器とし、設定置−ヒのそれは無
音区間とし、無音区間検出部と単語と単語の区別をする
休止区間を設定値に従って無音区間の場合と同様に検出
する休止区間検出部を有し、単語間の単語内ブロック区
間信号と1単語区間信号を実時間で発生させることを特
徴とする音声認識装置における音声区間検出方式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP59047939A JPS60191299A (ja) | 1984-03-13 | 1984-03-13 | 音声認識装置における音声区間検出方式 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP59047939A JPS60191299A (ja) | 1984-03-13 | 1984-03-13 | 音声認識装置における音声区間検出方式 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS60191299A true JPS60191299A (ja) | 1985-09-28 |
Family
ID=12789336
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP59047939A Pending JPS60191299A (ja) | 1984-03-13 | 1984-03-13 | 音声認識装置における音声区間検出方式 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS60191299A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014077969A (ja) * | 2012-10-12 | 2014-05-01 | Honda Motor Co Ltd | 対話システム及び対話システム向け発話の判別方法 |
-
1984
- 1984-03-13 JP JP59047939A patent/JPS60191299A/ja active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014077969A (ja) * | 2012-10-12 | 2014-05-01 | Honda Motor Co Ltd | 対話システム及び対話システム向け発話の判別方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US4800295A (en) | Retriggerable monostable multivibrator | |
JPS6147440B2 (ja) | ||
DE3481388D1 (de) | Text-zu-sprache-uebersetzungssystem. | |
JPS57185500A (en) | Voice recognition apparatus | |
EP0370473A3 (en) | Digital filter | |
EP0346774A1 (en) | Three-part decoder circuit | |
WO1990013122A1 (en) | Multi-purpose circuit for decoding binary information | |
JPS60191299A (ja) | 音声認識装置における音声区間検出方式 | |
De Mori et al. | A syntactic procedure for the recognition of glottal pulses in continuous speech | |
JPS6245242A (ja) | デジタルコ−デイングされた信号の伝送方法 | |
EP0346776A1 (en) | Three-part decoder circuit | |
SU801055A1 (ru) | Устройство дл воспроизведени МАгНиТНОй СигНАлОгРАММы | |
JPS6444643A (en) | Multiplexer | |
JPH01162440A (ja) | クロック抽出回路 | |
JPH0710047B2 (ja) | 零連誤り検出回路 | |
JPS62238599A (ja) | 音声区間検出方法 | |
JPH0518119B2 (ja) | ||
JPS62223800A (ja) | 音声入力装置 | |
KR940012946A (ko) | 잡음 제거회로 | |
JPS54122008A (en) | Data transmission system | |
SU1527638A1 (ru) | Устройство дл сопр жени ЭВМ со стереомагнитофоном | |
SU1767494A1 (ru) | Устройство управлени перфоратором | |
Yannakoudakis | Voice I/O: Problems and perspectives. | |
JPS59180594A (ja) | 音声認識装置 | |
JPS63222520A (ja) | B8zsコ−ダ/デコ−ダ回路 |