JPS6039691A - 音声認識方法 - Google Patents

音声認識方法

Info

Publication number
JPS6039691A
JPS6039691A JP14730983A JP14730983A JPS6039691A JP S6039691 A JPS6039691 A JP S6039691A JP 14730983 A JP14730983 A JP 14730983A JP 14730983 A JP14730983 A JP 14730983A JP S6039691 A JPS6039691 A JP S6039691A
Authority
JP
Japan
Prior art keywords
section
silent
voice
speech
plosive
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP14730983A
Other languages
English (en)
Other versions
JPH0474720B2 (ja
Inventor
金指 久則
秋場 国夫
入間野 孝雄
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Computer Basic Technology Research Association Corp
Original Assignee
Computer Basic Technology Research Association Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Computer Basic Technology Research Association Corp filed Critical Computer Basic Technology Research Association Corp
Priority to JP14730983A priority Critical patent/JPS6039691A/ja
Publication of JPS6039691A publication Critical patent/JPS6039691A/ja
Publication of JPH0474720B2 publication Critical patent/JPH0474720B2/ja
Granted legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 産業上の利用分野 本発明は入力音声の音素認識を行ない、その結果を用い
て、音節、単語2文章等を認識する音声認識方法 特に破裂音を認識する認識方法に関するものである。
従来例の構成とその問題点 一般に、音声の破裂音を認識する場合、破裂音の物理的
特徴としての破裂時点直前の無音区間を検出し、それを
利用して破裂音を認識する方法がとられる。第1図は、
従来の音声認識装置の破裂音検出部の構成図である。
以下にこの従来例の構成について第1図とともに説明す
る。第1図において1は環境騒音(ノイズ)を検出する
ノイズレベル検出部であり、このノイズレベル検出部1
の出力は無音部検出の閾値設定部2及び音声区間検出部
3に人力される。音声区間検出部3の出力は破裂音の無
音区間検出部4に入力される。
次に上記従来例の動作について第2図を用いて説明する
。第2図において、先ず、ノイズレベル検出部1で発声
環境のノイズレベル5を検出する。
このノイズレベル5を用いて、無音区間検出の閾値設定
部2において、閾値6の設定を行なう。同様にノイズレ
ベル5を利用して音声区間(音声区間の始端7.終端8
)を音声区間検出部3で検出する。破裂音の無音区間検
出部4において、無音区間(無音区間の始端9.終端1
0)e検出する。
しかしながら、上記従来例においては無音部の・ぞワー
の絶対値を使った闇値設定がなされているために調音結
合の影響により破裂音の無音区間の音声・やワーが十分
に小さくならない場合に、閾値以下にならず無音区間の
検出を誤る欠点があった。
その具体例を第3図に示す。
第3図は°゛囲い(KAKOr )”と発生した時の音
声ノe7−の時間変化を示した図である。/に/に挾ま
れた母音/A/が十分発声し終わらないうちに次の/に
/を発声するため2番目の/に/の直前の無音区間11
の249−が十分下がらないため、閾値12より大きく
なり無音区間の検出を誤る。この現象はとくに早口で発
声した場合に多発する。
発明の目的 本発明は、上記従来例の欠点を除去し、音声の調音結合
の影響により、従来検出が困難であった破裂音の無音区
間の検出の精度を向上させることを目的とするものであ
る。
発明の構成 本発明の音声認識方法は、上記目的を達成するために、
音声区間内の音声パワーの最大値−と最小値の差で音声
・母ワーを正規化し、その正規化した値によって破裂音
の無音区間検出の閾値を設定することを特徴とする。
実施例の説明 以下に本発明の一実施例について、図面と共に説明する
。第4図は本発明の一実施例の音声認識方法を実施する
装置の破裂音の無音区間検出部のプロヴク図である。
同図において、13はノイズレベル検出部であす、コノ
ノイズレ勺し検出部13の出方を使って音声区間検出部
14で音声区間を検出する。音声・切−正規化部15で
は音声区間検出部14の出方を用いて音声・やワーの正
規化を行ない破裂音の無音区間の閾値設定部16で閾値
を設定し、破裂音の無音区間検出部17で無音区間を検
出する。
次に上記実施例の動作について第5図を用いて説明する
。第5図において、ノイズレベル検出部13で検出され
たノイズレベルを使って、音声区間検出部14で音声区
間(音声区間の始端18゜終端19)を検出する。音声
・ぐワー正規化部15において、音声区間内における音
声・切−の最大値20 (MAX)及び最小値21 (
MIN) t−[出り、 次式に従って音声の正規化パ
ワーを算出する・但し、 PW(1) :第1フレームの音声・ぐワーMAX :
音声区間の最大値 MIN :音声区間の最小値 NPW(1) : 第1フレームの正規化音声・母ワー
この音声の正規化・やワーを用いて破裂音の無音区間検
出のための閾値22を設定する。破裂音の無音区間検出
部17においては第5図における正規化・ぐワーが減少
する区間23と正規化・やワーが急激に上昇する区間2
4を検出し無音区間の候補とする。さらに正規化パワー
が谷の区間25が閾値22より低く、かつ、区間25の
持続時間長が所定の値より短い場合に区間25を破裂音
の無音区間として検出する。
本実施例においては、音声の・ぐワーを音声区間内で正
規化しているため無音区間の検出は音声区間内のパワー
の大きさの比で判断できる。よって調音結合の影響によ
り破桜音の破裂直前の無音部のパワーの絶対値が十分に
低くならない場合においても、無音部を検出できる利点
がある。
なお、複数の話者の発声による認識実験において、従来
例では破裂音の無音区間の検出が85チであるのに対し
、本発明の方法を用いることにより、94%に検出率が
向上した。
発明の効果 本発明によれば破裂音の無音区間の検出に、音声区間内
で正規化したパワーを用いているため、調音結合によっ
て検出し難い破裂音の無音区間検出を精度よく検出でき
る利点を有する。
【図面の簡単な説明】
第1図は、従来の音声認識装置の破裂音の無音区間検出
部のブロック図、第2図、第3図は従来例の動作を説明
する図、第4図は不発明の一実施例における音声認識方
法を実施する装置の破裂音の無音区間検出部のブロック
図、第5図は本発明の一実施例の動作を説明する図であ
る。 13・・・ノイズレベル検出部、 14・・・音声区間検出部、 15・・・音声パワー正規化部、 16・・・無音区間閾値設定部、 17・・・破裂音の無音区間検出部。

Claims (1)

    【特許請求の範囲】
  1. 入力音声に対して単位時間毎に分析を行ない音素認識を
    行なった後に単語音声を認識する方法において、破裂音
    の認識に際し、破裂時点直前の無音区間の検出のための
    閾値を、音声区間の・やワーの最大値と最小値の差で正
    規化した値により設定することを特徴とする音声認識方
    法。
JP14730983A 1983-08-13 1983-08-13 音声認識方法 Granted JPS6039691A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP14730983A JPS6039691A (ja) 1983-08-13 1983-08-13 音声認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP14730983A JPS6039691A (ja) 1983-08-13 1983-08-13 音声認識方法

Publications (2)

Publication Number Publication Date
JPS6039691A true JPS6039691A (ja) 1985-03-01
JPH0474720B2 JPH0474720B2 (ja) 1992-11-26

Family

ID=15427276

Family Applications (1)

Application Number Title Priority Date Filing Date
JP14730983A Granted JPS6039691A (ja) 1983-08-13 1983-08-13 音声認識方法

Country Status (1)

Country Link
JP (1) JPS6039691A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61223796A (ja) * 1985-03-29 1986-10-04 沖電気工業株式会社 音声区間検出回路
JPS6377095A (ja) * 1986-09-19 1988-04-07 松下電器産業株式会社 音声区間の始端検出装置
JP2017067903A (ja) * 2015-09-29 2017-04-06 ヤマハ株式会社 音響解析装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5797599A (en) * 1980-12-10 1982-06-17 Matsushita Electric Ind Co Ltd System of detecting final end of each voice section

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5797599A (en) * 1980-12-10 1982-06-17 Matsushita Electric Ind Co Ltd System of detecting final end of each voice section

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61223796A (ja) * 1985-03-29 1986-10-04 沖電気工業株式会社 音声区間検出回路
JPS6377095A (ja) * 1986-09-19 1988-04-07 松下電器産業株式会社 音声区間の始端検出装置
JP2017067903A (ja) * 2015-09-29 2017-04-06 ヤマハ株式会社 音響解析装置

Also Published As

Publication number Publication date
JPH0474720B2 (ja) 1992-11-26

Similar Documents

Publication Publication Date Title
JP3069531B2 (ja) 音声認識方法
JPS6039691A (ja) 音声認識方法
JPS60129796A (ja) 音声入力装置
O'Shaughnessy Locating disfluencies in spontaneous speech: an acoustical analysis.
JPH07295588A (ja) 発話速度推定方法
JPS61260299A (ja) 音声認識装置
Dersch A decision logic for speech recognition
JPS59149400A (ja) 音声入力装置
JPS63217399A (ja) 音声区間検出装置
JPS61154550A (ja) 発声訓練装置
JPS63300295A (ja) 音声認識装置
JPS6073598A (ja) 音声認識方式
JPS63306498A (ja) 音声区間検出方式
JPS61140999A (ja) 音声区間検出方式
JPH0567039B2 (ja)
JPS63161499A (ja) 音声認識装置
JPS6039699A (ja) 音声認識方法
JPS5911920B2 (ja) 音声波形自動切り出し装置
JP2578771B2 (ja) 音声認識装置
JPS60198596A (ja) 音声入力装置
JPS5925240B2 (ja) 音声区間の語頭検出方式
JPS61233792A (ja) 音声認識装置
JPH0413719B2 (ja)
CHANGCHUN A new method to distinguish non-voice and voice in speech recognition
JPS59170894A (ja) 音声区間の切り出し方式