JPS6039691A - 音声認識方法 - Google Patents
音声認識方法Info
- Publication number
- JPS6039691A JPS6039691A JP14730983A JP14730983A JPS6039691A JP S6039691 A JPS6039691 A JP S6039691A JP 14730983 A JP14730983 A JP 14730983A JP 14730983 A JP14730983 A JP 14730983A JP S6039691 A JPS6039691 A JP S6039691A
- Authority
- JP
- Japan
- Prior art keywords
- section
- silent
- voice
- speech
- plosive
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
産業上の利用分野
本発明は入力音声の音素認識を行ない、その結果を用い
て、音節、単語2文章等を認識する音声認識方法 特に破裂音を認識する認識方法に関するものである。
て、音節、単語2文章等を認識する音声認識方法 特に破裂音を認識する認識方法に関するものである。
従来例の構成とその問題点
一般に、音声の破裂音を認識する場合、破裂音の物理的
特徴としての破裂時点直前の無音区間を検出し、それを
利用して破裂音を認識する方法がとられる。第1図は、
従来の音声認識装置の破裂音検出部の構成図である。
特徴としての破裂時点直前の無音区間を検出し、それを
利用して破裂音を認識する方法がとられる。第1図は、
従来の音声認識装置の破裂音検出部の構成図である。
以下にこの従来例の構成について第1図とともに説明す
る。第1図において1は環境騒音(ノイズ)を検出する
ノイズレベル検出部であり、このノイズレベル検出部1
の出力は無音部検出の閾値設定部2及び音声区間検出部
3に人力される。音声区間検出部3の出力は破裂音の無
音区間検出部4に入力される。
る。第1図において1は環境騒音(ノイズ)を検出する
ノイズレベル検出部であり、このノイズレベル検出部1
の出力は無音部検出の閾値設定部2及び音声区間検出部
3に人力される。音声区間検出部3の出力は破裂音の無
音区間検出部4に入力される。
次に上記従来例の動作について第2図を用いて説明する
。第2図において、先ず、ノイズレベル検出部1で発声
環境のノイズレベル5を検出する。
。第2図において、先ず、ノイズレベル検出部1で発声
環境のノイズレベル5を検出する。
このノイズレベル5を用いて、無音区間検出の閾値設定
部2において、閾値6の設定を行なう。同様にノイズレ
ベル5を利用して音声区間(音声区間の始端7.終端8
)を音声区間検出部3で検出する。破裂音の無音区間検
出部4において、無音区間(無音区間の始端9.終端1
0)e検出する。
部2において、閾値6の設定を行なう。同様にノイズレ
ベル5を利用して音声区間(音声区間の始端7.終端8
)を音声区間検出部3で検出する。破裂音の無音区間検
出部4において、無音区間(無音区間の始端9.終端1
0)e検出する。
しかしながら、上記従来例においては無音部の・ぞワー
の絶対値を使った闇値設定がなされているために調音結
合の影響により破裂音の無音区間の音声・やワーが十分
に小さくならない場合に、閾値以下にならず無音区間の
検出を誤る欠点があった。
の絶対値を使った闇値設定がなされているために調音結
合の影響により破裂音の無音区間の音声・やワーが十分
に小さくならない場合に、閾値以下にならず無音区間の
検出を誤る欠点があった。
その具体例を第3図に示す。
第3図は°゛囲い(KAKOr )”と発生した時の音
声ノe7−の時間変化を示した図である。/に/に挾ま
れた母音/A/が十分発声し終わらないうちに次の/に
/を発声するため2番目の/に/の直前の無音区間11
の249−が十分下がらないため、閾値12より大きく
なり無音区間の検出を誤る。この現象はとくに早口で発
声した場合に多発する。
声ノe7−の時間変化を示した図である。/に/に挾ま
れた母音/A/が十分発声し終わらないうちに次の/に
/を発声するため2番目の/に/の直前の無音区間11
の249−が十分下がらないため、閾値12より大きく
なり無音区間の検出を誤る。この現象はとくに早口で発
声した場合に多発する。
発明の目的
本発明は、上記従来例の欠点を除去し、音声の調音結合
の影響により、従来検出が困難であった破裂音の無音区
間の検出の精度を向上させることを目的とするものであ
る。
の影響により、従来検出が困難であった破裂音の無音区
間の検出の精度を向上させることを目的とするものであ
る。
発明の構成
本発明の音声認識方法は、上記目的を達成するために、
音声区間内の音声パワーの最大値−と最小値の差で音声
・母ワーを正規化し、その正規化した値によって破裂音
の無音区間検出の閾値を設定することを特徴とする。
音声区間内の音声パワーの最大値−と最小値の差で音声
・母ワーを正規化し、その正規化した値によって破裂音
の無音区間検出の閾値を設定することを特徴とする。
実施例の説明
以下に本発明の一実施例について、図面と共に説明する
。第4図は本発明の一実施例の音声認識方法を実施する
装置の破裂音の無音区間検出部のプロヴク図である。
。第4図は本発明の一実施例の音声認識方法を実施する
装置の破裂音の無音区間検出部のプロヴク図である。
同図において、13はノイズレベル検出部であす、コノ
ノイズレ勺し検出部13の出方を使って音声区間検出部
14で音声区間を検出する。音声・切−正規化部15で
は音声区間検出部14の出方を用いて音声・やワーの正
規化を行ない破裂音の無音区間の閾値設定部16で閾値
を設定し、破裂音の無音区間検出部17で無音区間を検
出する。
ノイズレ勺し検出部13の出方を使って音声区間検出部
14で音声区間を検出する。音声・切−正規化部15で
は音声区間検出部14の出方を用いて音声・やワーの正
規化を行ない破裂音の無音区間の閾値設定部16で閾値
を設定し、破裂音の無音区間検出部17で無音区間を検
出する。
次に上記実施例の動作について第5図を用いて説明する
。第5図において、ノイズレベル検出部13で検出され
たノイズレベルを使って、音声区間検出部14で音声区
間(音声区間の始端18゜終端19)を検出する。音声
・ぐワー正規化部15において、音声区間内における音
声・切−の最大値20 (MAX)及び最小値21 (
MIN) t−[出り、 次式に従って音声の正規化パ
ワーを算出する・但し、 PW(1) :第1フレームの音声・ぐワーMAX :
音声区間の最大値 MIN :音声区間の最小値 NPW(1) : 第1フレームの正規化音声・母ワー
この音声の正規化・やワーを用いて破裂音の無音区間検
出のための閾値22を設定する。破裂音の無音区間検出
部17においては第5図における正規化・ぐワーが減少
する区間23と正規化・やワーが急激に上昇する区間2
4を検出し無音区間の候補とする。さらに正規化パワー
が谷の区間25が閾値22より低く、かつ、区間25の
持続時間長が所定の値より短い場合に区間25を破裂音
の無音区間として検出する。
。第5図において、ノイズレベル検出部13で検出され
たノイズレベルを使って、音声区間検出部14で音声区
間(音声区間の始端18゜終端19)を検出する。音声
・ぐワー正規化部15において、音声区間内における音
声・切−の最大値20 (MAX)及び最小値21 (
MIN) t−[出り、 次式に従って音声の正規化パ
ワーを算出する・但し、 PW(1) :第1フレームの音声・ぐワーMAX :
音声区間の最大値 MIN :音声区間の最小値 NPW(1) : 第1フレームの正規化音声・母ワー
この音声の正規化・やワーを用いて破裂音の無音区間検
出のための閾値22を設定する。破裂音の無音区間検出
部17においては第5図における正規化・ぐワーが減少
する区間23と正規化・やワーが急激に上昇する区間2
4を検出し無音区間の候補とする。さらに正規化パワー
が谷の区間25が閾値22より低く、かつ、区間25の
持続時間長が所定の値より短い場合に区間25を破裂音
の無音区間として検出する。
本実施例においては、音声の・ぐワーを音声区間内で正
規化しているため無音区間の検出は音声区間内のパワー
の大きさの比で判断できる。よって調音結合の影響によ
り破桜音の破裂直前の無音部のパワーの絶対値が十分に
低くならない場合においても、無音部を検出できる利点
がある。
規化しているため無音区間の検出は音声区間内のパワー
の大きさの比で判断できる。よって調音結合の影響によ
り破桜音の破裂直前の無音部のパワーの絶対値が十分に
低くならない場合においても、無音部を検出できる利点
がある。
なお、複数の話者の発声による認識実験において、従来
例では破裂音の無音区間の検出が85チであるのに対し
、本発明の方法を用いることにより、94%に検出率が
向上した。
例では破裂音の無音区間の検出が85チであるのに対し
、本発明の方法を用いることにより、94%に検出率が
向上した。
発明の効果
本発明によれば破裂音の無音区間の検出に、音声区間内
で正規化したパワーを用いているため、調音結合によっ
て検出し難い破裂音の無音区間検出を精度よく検出でき
る利点を有する。
で正規化したパワーを用いているため、調音結合によっ
て検出し難い破裂音の無音区間検出を精度よく検出でき
る利点を有する。
第1図は、従来の音声認識装置の破裂音の無音区間検出
部のブロック図、第2図、第3図は従来例の動作を説明
する図、第4図は不発明の一実施例における音声認識方
法を実施する装置の破裂音の無音区間検出部のブロック
図、第5図は本発明の一実施例の動作を説明する図であ
る。 13・・・ノイズレベル検出部、 14・・・音声区間検出部、 15・・・音声パワー正規化部、 16・・・無音区間閾値設定部、 17・・・破裂音の無音区間検出部。
部のブロック図、第2図、第3図は従来例の動作を説明
する図、第4図は不発明の一実施例における音声認識方
法を実施する装置の破裂音の無音区間検出部のブロック
図、第5図は本発明の一実施例の動作を説明する図であ
る。 13・・・ノイズレベル検出部、 14・・・音声区間検出部、 15・・・音声パワー正規化部、 16・・・無音区間閾値設定部、 17・・・破裂音の無音区間検出部。
Claims (1)
- 入力音声に対して単位時間毎に分析を行ない音素認識を
行なった後に単語音声を認識する方法において、破裂音
の認識に際し、破裂時点直前の無音区間の検出のための
閾値を、音声区間の・やワーの最大値と最小値の差で正
規化した値により設定することを特徴とする音声認識方
法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP14730983A JPS6039691A (ja) | 1983-08-13 | 1983-08-13 | 音声認識方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP14730983A JPS6039691A (ja) | 1983-08-13 | 1983-08-13 | 音声認識方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS6039691A true JPS6039691A (ja) | 1985-03-01 |
JPH0474720B2 JPH0474720B2 (ja) | 1992-11-26 |
Family
ID=15427276
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP14730983A Granted JPS6039691A (ja) | 1983-08-13 | 1983-08-13 | 音声認識方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS6039691A (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS61223796A (ja) * | 1985-03-29 | 1986-10-04 | 沖電気工業株式会社 | 音声区間検出回路 |
JPS6377095A (ja) * | 1986-09-19 | 1988-04-07 | 松下電器産業株式会社 | 音声区間の始端検出装置 |
JP2017067903A (ja) * | 2015-09-29 | 2017-04-06 | ヤマハ株式会社 | 音響解析装置 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5797599A (en) * | 1980-12-10 | 1982-06-17 | Matsushita Electric Ind Co Ltd | System of detecting final end of each voice section |
-
1983
- 1983-08-13 JP JP14730983A patent/JPS6039691A/ja active Granted
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5797599A (en) * | 1980-12-10 | 1982-06-17 | Matsushita Electric Ind Co Ltd | System of detecting final end of each voice section |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS61223796A (ja) * | 1985-03-29 | 1986-10-04 | 沖電気工業株式会社 | 音声区間検出回路 |
JPS6377095A (ja) * | 1986-09-19 | 1988-04-07 | 松下電器産業株式会社 | 音声区間の始端検出装置 |
JP2017067903A (ja) * | 2015-09-29 | 2017-04-06 | ヤマハ株式会社 | 音響解析装置 |
Also Published As
Publication number | Publication date |
---|---|
JPH0474720B2 (ja) | 1992-11-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3069531B2 (ja) | 音声認識方法 | |
JPS6039691A (ja) | 音声認識方法 | |
JPS60129796A (ja) | 音声入力装置 | |
O'Shaughnessy | Locating disfluencies in spontaneous speech: an acoustical analysis. | |
JPH07295588A (ja) | 発話速度推定方法 | |
JPS61260299A (ja) | 音声認識装置 | |
Dersch | A decision logic for speech recognition | |
JPS59149400A (ja) | 音声入力装置 | |
JPS63217399A (ja) | 音声区間検出装置 | |
JPS61154550A (ja) | 発声訓練装置 | |
JPS63300295A (ja) | 音声認識装置 | |
JPS6073598A (ja) | 音声認識方式 | |
JPS63306498A (ja) | 音声区間検出方式 | |
JPS61140999A (ja) | 音声区間検出方式 | |
JPH0567039B2 (ja) | ||
JPS63161499A (ja) | 音声認識装置 | |
JPS6039699A (ja) | 音声認識方法 | |
JPS5911920B2 (ja) | 音声波形自動切り出し装置 | |
JP2578771B2 (ja) | 音声認識装置 | |
JPS60198596A (ja) | 音声入力装置 | |
JPS5925240B2 (ja) | 音声区間の語頭検出方式 | |
JPS61233792A (ja) | 音声認識装置 | |
JPH0413719B2 (ja) | ||
CHANGCHUN | A new method to distinguish non-voice and voice in speech recognition | |
JPS59170894A (ja) | 音声区間の切り出し方式 |