JPH0449953B2 - - Google Patents

Info

Publication number
JPH0449953B2
JPH0449953B2 JP58138011A JP13801183A JPH0449953B2 JP H0449953 B2 JPH0449953 B2 JP H0449953B2 JP 58138011 A JP58138011 A JP 58138011A JP 13801183 A JP13801183 A JP 13801183A JP H0449953 B2 JPH0449953 B2 JP H0449953B2
Authority
JP
Japan
Prior art keywords
vowel
level
center
power
detecting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP58138011A
Other languages
English (en)
Other versions
JPS6029798A (ja
Inventor
Yoshiteru Mifune
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP58138011A priority Critical patent/JPS6029798A/ja
Publication of JPS6029798A publication Critical patent/JPS6029798A/ja
Publication of JPH0449953B2 publication Critical patent/JPH0449953B2/ja
Granted legal-status Critical Current

Links

Description

【発明の詳細な説明】 産業上の利用分野 本発明は、音節を単位として連続発声された単
語、文節および文章等を認識する音声認識装置に
関する。
従来例の構成とその問題点 従来の連続音声認識装置等における、無音区間
検出方式は主として、音声区間を検出する目的の
ために行なわれていたので、一定の低いレベル以
下のフレームが長く連続している区間を検出して
おり、語中の無音区間を検出してセグメンテーシ
ヨンの考え方としているものは、ほとんど無かつ
た。そして、やや認識精度を高める装置において
は、無音区間の検出処理も行なわれていたが、単
に一定のレベル以下の連続フレームを検出してい
るに過ぎなかつた。しかしこのような処理では、
検出レベルが一定であるため、例えば/ASA/
の子音Sの所で無音区間が検出されたり、発声レ
ベルの強弱によつて破裂音/p/,/t/,/
k/,/b/,/d/,/g/の前に無音が検出
されなかつたりして検出精度に問題があり、無音
区間によるセグメンテーシヨンがあいまいである
ためにかえつて認識率を低下させる原因となつて
いた。
発明の目的 本発明は上記問題点に鑑み、不要な子音区間を
無音区間として誤検出することなく、また発声レ
ベルの強弱の影響を受けることのない、簡単な構
成の音声認識装置を提供することを目的とする。
発明の構成 本発明は、入力音声を特徴ベクトル{xti}と
電力{Pti}の時系列に変換したものと、各フレ
ーム毎の母音識別結果から、母音定常部中心
{iv1,iv2,iv3……ivN}を検出しておき、隣接す
る母音定常部中心間の範囲{〔iv1,iv2〕,〔iv2
iv3〕,……,〔ivN-1,ivN〕}において、各々の母
音定常部中心間の範囲{〔ivj-1,ivj〕}で、前も
つて定められた電力レベルの國値{θpz}、前の母
音定常部中心のレベル{P(ivj-1)}に一定比率
{Cz<1}を乗じた電力レベル、および後の母音定
常部中心のレベル{P(ivj)}に一定比率
{Cz<1}を乗じた電力レベルの3つの電力レベル
の最大値{max{θpz,P(ivj-1),P(ivj)}}を

音検出レベルとし、その母音定常中心間の範囲で
上記無音検出レベル以下の連続フレームを無音区
間として検出し、同様の処理を母音定常部中心間
の範囲を順次シフトして行い、入力音声中の無音
区間を検出することにより、簡単な構成で不要な
子音区間を無音区間と誤検出することなく、また
発声レベルの変動も受けない、無音区間検出装置
の実用化を図るものである。
実施例の説明 本発明の具体的な実施例の構成を以下に説明す
る。
第1図は、本発明の一実施例における音声認識
装置の構成を示しており、入力部はA/D変換器
1、電力系列変換手段2、特徴系列変換手段3か
らなる。4は、入力音声の電力系列によつて長い
無音を検出して音声区間を検出する音声区間検出
手段である。6は、入力音声のピーク電力を検出
するピーク電力検出手段6aと特徴ベクトル系列
のベクトル毎に母音識別を行う母音識別手段6b
からなり、ピーク電力の前後のフレームにおける
母音識別結果の同一母音中心から、母音定常部中
心を検出する母音定常部中心検出手段である。5
は、母音定常部中心検出手段6で検出された隣接
する母音定常部中心間の範囲において、前もつて
定められたレベル、前の母音定常部中心のレベル
に一定の比率を乗じたレベル、および後の母音定
常部中心のレベルに一定の比率を乗じたレベルの
3つのレベルの最大値以下のレベルの連続フレー
ムによつて無音区間を検出する無音区間検出手段
である。7は、特徴ベクトルの形でCV音節7a
もしくは、V1CV2音節7bの単位で記憶する標
準パターン記憶部である。8は、平均発声長
{L}フレーム分だけ、特徴ベクトルの系列を記
憶する特徴系列記憶部である。9は、特徴系列記
憶部8における、語頭4aもしくは無音区間終了
5bから平均発声長{L}フレーム以内の母音定
常部中心6cまでの区間にはCV標準パターン7
aとパタンマツチング行ない、平均発声長{L}
フレーム以内の母音定常部中心6cから母音定常
部中心6cの区間の場合には、V1CV2標準パタ
ーン7bとパタンマツチングを行うパタンマツチ
ング手段である。10は、音声区間検出手段4、
無音区間検出手段5、母音定常部中心検出手段
6、特徴系列記憶部8、およびパタンマツチング
手段9を全体的に制御して入力音声の母音定常部
中心母に語頭や無音区間の情報を使用して、CV
音節とV1CV2音節とのパタンマツチング結果を
接続して、CV音節のストリングスとして認識結
果を出力する総合制御手段である。
ここで無音区間検出手段の詳細な説明を以下に
行なう。
第2図、第3図は、上記実施例の無音区間検出
手段の具体的ブロツク図および動作を説明する原
理図であり、第2図において無音区間検出手段5
は、平均発声長{L}フレーム分の電力系列を記
憶する電力系記憶手段5c、母音定常部中心検出
手段6によつて検出される母音定常部中心{ivj
と、前の母音定常部中心{ivj-1}の範囲で、前
もつて定められた電力レベル{θpz}5C3、前の
母音定常部中心の電力レベルP(ivj-1)5C2に一
定比率Czを乗じたレベル、および後の母音定常部
中心の電力レベルP(ivj)5C1に一定比率Czを乗
じたレベルの3つのレベルの最大値を決定する最
大レベル検出手段5d、および最大レベル検出手
段5dで決定された無音区間検出レベル5d1と前
の母音定常部中心{ivj-1}と後の母音定常部中
心{ivj}の間の範囲の電力値系列と比較して、
無音区間検出レベル5d1以下の連続フレームの開
始フレームと終了フレームを各々無音区開始5
a、無音区間終了5bとして出力する電力レベル
比較手段5eより成る。
第2図に示した無音区間検出手段5の動作説明
を第3図を用いて以下に行なう。
第3図において、入力音声vは/ヒバリが/と
発声されたことを示しており、母音定常部中心検
出手段6が母音定常部中心{iv2}を検出すると、
電力系列記憶手段5cに記憶された前の母音定常
部中心{iv1}における電力レベルP(iv1)5C2
および後の母音定常部中心{iv2}における電力
レベルP(iv2)5C1に一定比率{Cz<1}を乗じ
たもの{P(iv1)*Cz,P(iv2)*Cz}と、前も
つて定めた電力レベル{θpz}5c3の最大値
(LP12=max{θpz,P(iv1)*Cz,P(iv2)*Cz

を最大レベル検出手段5dによつて決定し、前の
母音定常部中心{iv1}と後の母音定常部中心
{iv2}の範囲内で最大値{LP12}以下となる連続
フレームを検出するが、iv1iiv2の範囲で検
出されないならば、無音区間ナシとする。同様の
処理を母音定常部中心{iv3}が検出された場合
にも行う。このとき、LP23=max{θpz,P(iv2
*Cz)である。しかし、次に、LP34=max{θpz
P(iv3)*Cz,P(iv4)*Cz}により、母音定常
部中心{iv4}が検出された場合のように無音区
間{iss1〜iSE1)が検出されると、無音区間開始
{iss1}5a、無音区間終了{iSE1}5bとして出
力する。
第4図は第1図に示した連続音声認識装置の動
作原理を示しおり、同図において、入力声v
が、/ヒバリが空に/と発声されたことを示して
おり語頭4a〜語尾4bは、音声区間検出手段4
によつて検出される。母音定常部中心検出手段6
は電力レベルと各フレームの母音識別結果から、
母音定常部中心〔iv1,iv2,……,iv7〕13を検
出する。
母声定常部中心{ivj}が検出されるごとに1
つの前の母音定常部中心{ivj-1}との間に無音
区間が存在するか否を無音区間検出手段5によつ
て判定し、存在する場合は無音区間{iss1〜iSE1
iss2〜iSE2}として検出する。
また母音定常部中心{ivj}が検出されると、
{ivj}から平均発声長{L}フレームF手前に、
語頭4aもしくは、無音区間終了5b{iSE1,iSE2
が検出されているならば、語頭もしくは無音区間
終了から{ivj}までの区間に対して、CV標準パ
ターン7aとパタンマツチン手段9によつてマツ
チングを行ない認識結果とする。
{ivj}から平均発声長{L}フレームF手前
に語頭も無音区間も検出されないならば、平均発
声長{L}フレームF手前まで含まれる母音定常
部中心{ivj-P}から{ivj}をVCVマツチング区
間として、母音定常部中心の組合せ{〔ivj-P
ivj〕〔ivj-p+1,ivj〕……〔ivj-1,ivj〕}の区間に
対して、VCV標準パタン7bとパタンマツチン
グ手段9によつてマツチングを行い、最適なマツ
チング範囲としCV認識結果とする。図中、
CVT1,CVT2,CVT3はCVマツチング区間を、
VCVT1,VCVT2はVCVマツチング区間を
NVT1,NVT2は無音区間をそれぞれ示す。
総合制御手段10は、語尾4bが検出されると
最終母音定常部中心13{iv7}から語頭4a方
向に母音定常部中心をバツクトレースする。つま
り{iv7}では{iv6}が最適区間で認識結果は
〔ANi〕、同様に{iv6}は{iv5}で〔ORA〕、
{iv5}では無音区間終了{iSE}が最適範囲で、
認識結果は〔SO〕、{iv3}は{iv2}で〔ARi〕、
{iv2}では{iv1}で〔iBA〕、{iv1}では語頭4
aが最適範囲で〔Hi〕が認識されていたとする
と、総合制御手段10は、認識結果として、
「HiBARi GA SORANi」を出力する。
発明の効果 本発明は、入力音声の特徴ベクトルと、電力値
の系列から、母音定常部中心{iv1,iv2,……,
ivN}を検出しておき、隣接する母音定常部中心
間の範囲{〔iv1,iv2〕〔iv2,iv3〕……〔ivN-1
ivN}において、各々の母音定常部中心の範囲
{〔ivj-1,ivj〕}で、前もつて定めた電力レベル
{θpz}、前の母音定常部中心レベル{P(ivj-1)}
に比率{Cz<1}を乗じたレベル後の母音定常部
中心レベル{P(ivj)}に比率{Cz<1}を乗じた
レベルの最大値を無音検出レベルとして、上記の
範囲{〔ivj-1ivj}中での電力レベヌが連続して無
音検出レベル以下となる区間を無音区間とし同様
の処理を母音定常部中心間の範囲を順次移動して
入力音声中の無音区間を検出することによつて、
簡単な構成で、不要な区間の検出誤りを起こさず
また、発声レベルの変動も受けない、無音区間検
出装置の実用化を可能に出来る。
【図面の簡単な説明】
第1図は本発明の一実施例における音声認識装
置のブロツク図、第2図は同実施例における無音
区間検出手段を示すブロツク図、第3図は第2図
の動作を説明する原理図、第4図は第1図に示し
た装置の動作を説明する原理図である。 1……A/D変換器、2……電力系列変換手
段、3……特徴系列変換手段、4……音声区間検
出手段、5……無音区間検出手段、6……母音定
常部中心検出手段、7……標準パターン記憶部、
8……特徴系列記憶部、9……パターンマツチン
グ手段、10……総合制御手段、5c……電力系
列記憶手段、5d……最大レベル検出手段、5e
……電力レベル比較手段。

Claims (1)

    【特許請求の範囲】
  1. 1 入力音声を特徴ベクトルの時系列に変換する
    特徴系列変換手段、前記入力音声を電力値の時系
    列に変換する電力系列変換手段、前記電力値の時
    系列が所定のレベル以上の連続フレーム内で前記
    特徴ベクトルの母音識別結果が同一で連続するフ
    レームの中心を母音定常部中心として検出する母
    音定常部中心検出手段と、前記母音定常中心検出
    手段で検出した隣接する母音定常部中心の間の範
    囲において、予め定められた電力レベルの閾値
    と、前の母音定常部中心のレベルに一定比率を乗
    じた電力レベルと、後の母音定常部中心のレベル
    に一定比率を乗じた電力レベルとの3つのレベル
    の最大値を無音検出レベルとして検出する最大レ
    ベル検出手段と、前記隣接した母音定常部中心の
    範囲で、前記無音検出レベル以下の連続フレーム
    を無音区間として検出する電力レベル比較手段と
    を備えたことを特徴とする音声認識装置。
JP58138011A 1983-07-28 1983-07-28 音声認識装置 Granted JPS6029798A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58138011A JPS6029798A (ja) 1983-07-28 1983-07-28 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58138011A JPS6029798A (ja) 1983-07-28 1983-07-28 音声認識装置

Publications (2)

Publication Number Publication Date
JPS6029798A JPS6029798A (ja) 1985-02-15
JPH0449953B2 true JPH0449953B2 (ja) 1992-08-12

Family

ID=15211968

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58138011A Granted JPS6029798A (ja) 1983-07-28 1983-07-28 音声認識装置

Country Status (1)

Country Link
JP (1) JPS6029798A (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2507984Y2 (ja) * 1989-03-01 1996-08-21 北陽電機株式会社 発火検知器

Also Published As

Publication number Publication date
JPS6029798A (ja) 1985-02-15

Similar Documents

Publication Publication Date Title
US5692104A (en) Method and apparatus for detecting end points of speech activity
JP3069531B2 (ja) 音声認識方法
JP3535292B2 (ja) 音声認識システム
JP2996019B2 (ja) 音声認識装置
JP3523382B2 (ja) 音声認識装置及び音声認識方法
JPH0449953B2 (ja)
KR100350003B1 (ko) 음성신호로부터워드를결정하는시스템
JPH08314490A (ja) ワードスポッティング型音声認識方法と装置
JPH0222399B2 (ja)
JPH10116093A (ja) 音声認識装置
JPH0242238B2 (ja)
KR930011739B1 (ko) 초성 프리매칭의 2단매칭을 이용한 음성 인식방법
KR100363251B1 (ko) 음성 끝점 판별 방법
JPH05303391A (ja) 音声認識装置
JPH0534677B2 (ja)
JPH0876789A (ja) 不特定話者単語音声認識システムおよび不特定話者単語音声認識方法
JPH0217118B2 (ja)
JPH0554117B2 (ja)
JPS6027000A (ja) パタンマツチング方法
JPH0449716B2 (ja)
JPH0756595A (ja) 音声認識装置
JPS5925240B2 (ja) 音声区間の語頭検出方式
JPH0424697A (ja) 音声認識装置
JPH03145167A (ja) 音声認識方式
JPS6033599A (ja) 音声認識装置