JPH0449716B2 - - Google Patents

Info

Publication number
JPH0449716B2
JPH0449716B2 JP58134598A JP13459883A JPH0449716B2 JP H0449716 B2 JPH0449716 B2 JP H0449716B2 JP 58134598 A JP58134598 A JP 58134598A JP 13459883 A JP13459883 A JP 13459883A JP H0449716 B2 JPH0449716 B2 JP H0449716B2
Authority
JP
Japan
Prior art keywords
vowel
center
stationary part
word
syllables
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP58134598A
Other languages
English (en)
Other versions
JPS6026400A (ja
Inventor
Yoshiteru Mifune
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP58134598A priority Critical patent/JPS6026400A/ja
Publication of JPS6026400A publication Critical patent/JPS6026400A/ja
Publication of JPH0449716B2 publication Critical patent/JPH0449716B2/ja
Granted legal-status Critical Current

Links

Description

【発明の詳細な説明】 産業上の利用分野 本発明は、日本語最小発声単位であるCV音節
もしくはVCV音節を前もつて登録しておき、登
録話者が発声した単語や文節および文章を認識す
る連続音声認識装置に関する。
従来例の構成とその問題点 従来の連続音声認識装置として、フレーム毎に
前もつて登録された音素パターン、例えば5母音
|A||i||u||E||O|、子音|S||
C||h|,|p||t||k|,|b||d||
g|,|m||n||r|等との距離を計算して
音素識別し、その距離を計算して音素識別し、そ
の結果をマージ(例えば連続音素は1音素に代表
し、不連続音素は切り捨てする等)処理して、認
識結果とするものがあつた。しかしこの装置はそ
の構成が簡単である反面、調合結合等による音の
変形が起るためにセグメンテーシヨンがあいまい
(音韻区間が不明瞭)であるため認識率は著しく
低下する欠点があつた。さらに認識率を向上させ
た連続音声認識装置としては、CV音節を前もつ
て標準パタンとして登録しておき、2段DP手法
と呼ばれている、個々の登録CV音節とは時間軸
伸縮を行つた上で、全体として最適なCV音節系
列を決定する、パターンマツチング手法を用い
て、音節系列として認識結果を求めているもの
や、VCV音節も登録して同様な2段DP手法によ
つて認識結果を求めているものがあつた。しかし
このような2段DP手法を用いる装置では、実時
間処理を行うために莫大な計算値を実行する専用
ハードウエアを必要とし、コスト低減が困難であ
つた。また、種々の方法に比べて認識率が優れて
いるものの、2段DP手法に固有の挿入、脱落誤
り(例えば、2音節データを3音節としてマツチ
ングして誤認識する、また2音節データを1音節
としてマツチングして誤認識する)が発生するこ
とが有り、対策処理が困難であるため認識率にも
限界があつた。
発明の目的 本発明は上記従来の欠点を除去し、簡単な構成
で実時間処理を可能とすると共に、高い認識率を
実現した連続音声認識装置を提供することを目的
とする。
発明の構成 本発明による連続音声認識装置は入力音声を特
徴べクトルと電力の時系列に変換し、各フレーム
毎の母音識別結果から母音定常部中心と無音区関
を検出し、語頭から最終母音定常部中心{iVN
までの範囲において、誤頭および無音区間終了か
ら前もつて定めれた平均発声速度長{L}フレー
ム内の母音定常部中心までは、前もつて記憶CV
標準パタンとのパタンマツチングによつて認識を
行ない、また無音区間を含まない母音定常部中心
から母音定常部中心の範囲においては、母音定常
部中心ごとに、現在の処理中母音定常部中心フレ
ームから、前もつて定められた平均発生速度長ま
で逆昇つた時点に含まれる母音定常部中心までを
認識範囲として、現在の処理母音定常部中心との
すべての組合せの区間に対して、前もつて記憶し
たV1CV2標準パタンとのパタンマツチングを行
つて最適区間とV1CV2認識結果を検出するよう
にし、前記無音区間のない母音定常部中心から母
音定常部中心の範囲においては、最終母音定常部
中心から最適区間を与える母音定常部中心を検出
し、その母音定常中心からさらに同様な最適区間
を与える母音定常部中心を検出し、先頭の母音定
常部中心までたどり、各々のV1CV2系列とする。
また語頭および無音区間の終了フレームから直後
の母音定常部中心はCV認識結果を認識CV系列と
する。そして前記とCV系列とV1CV2系列をつな
ぎ合せたものを連続認識結果とするものである。
実施例の説明 以下に本発明の実施例について説明する。
第1図において、1は入力端子より入力された
信号をデイジタル信号に変換するA/D変換器、
2は電力系列変換手段、3は入力信号を特徴ベク
トルの時系列パタンに変換する特徴系列変換手段
である。4は入力音声の電力系列によつて長い無
音を検出して音声区間を検出する音声区間検出手
段である。5は音声区間検出手段4によつて切り
出される音声区間において電力系列によつて短い
無音を検出して無音区間を検出する無音区間検出
手段である。6は入力音声のピーク電力を検出す
るピーク電力検出手段6aと特徴ベクトル系列の
ベクトル毎に母音識別を行う母音識別手段6bか
らなり、ピーク電力の前後のフレームにおける母
音識別結果の同一母音中心から、母音定常部中心
を検出する母音定常部中心検出部である。
7は入力音声を特徴ベクトルの形でCV音節も
しくは、V1CV2音節の単位でそのベクトルを記
憶する標準パタン記憶部、8は平均発声長Lフレ
ーム分だけ、母音認識結果の系列を記憶する母音
系列記憶部8aと特徴ベクトルの系列を記憶する
特徴系列記憶部8bからなる記憶部である。9は
特徴ベクトル記憶部8bにおける語頭4aもしく
は無音区間終了5bから直後の母音定常部中心6
cまでの区間の場合にはCV標準パタン7aとパ
タンマツチングを行い、平均発声長Lフレーム以
内の母音定常中心6cから母音定常部中心6cの
区間の場合にはV1CV2標準パタン7bとパタン
マツチングを行うパタンマツチング手段である。
10は音声区間検出手段4、無音区間検出手段
5、母音定常部中心検出部6、記憶部8およびパ
タンマツチング手段9を制御して、入力音声の母
音定常部中心に語頭や無音区間の情報を使用し
て、CV音節と、V1CV2音節とパタンマツチング
結果を接続して、CV音節のストリングスとして
認識結果を出力する総合制御手段である。12は
音声認識動作中には端子12aに、標準パタン作
成時には端子12bに接続される切換スイツチで
ある。
次にこの実施例の動作を第2図および第3図と
ともに以下に説明する。入力端子11に入力され
た音声信号はA/D変換器1によりデイジタル信
号に変換され、電力系列変換手段2に加えられ
る。この手段2の出力の一例を第2図イに示す。
この波形は入力音声が、|ヒバリが空に|と発声
された場合のものである。その音声信号の語頭4
a〜語尾4bは、音声区間検出手段4によつて検
出される。また一定の闘値以上となる電力系列が
一定フレーム長以上連続している期間で、かつ母
音識別手段6bによつて識別された母音が同一種
類で一定フレーム長以上連続する場合に、ピーク
電力検出手段6aによつて母音系列の中心を検出
するその検出点を図中にiV1、iV2……、iV6とし
て示している。また母音系列が2種類連続する場
合には2重母音として各々の中心を検出する。そ
して上述した母音定常部中心が検出される毎に、
その前の母音定常部中心との間に無音区間が存在
するか否かを無音区間検出手段5によつて検出し
て、無音区間開始5a、終了5b(iSS1、iSE1
(iSS2、iSE2)として検出する。上述した母音定常
部中心iVjが検出されると、iVjから平均発声長L
のフレーム手前に、語頭4aもしくは、無音区間
終了5b(iSE1、iSE2)が検出されているならば、
語頭もしくは無音区間終了から母音定常部中心
iVjまでの区間に対してCV標準パタン7aとパタ
ンマツチング手段9によつてマツチングを行ない
認識結果とする。母音定常部中心iVjから平均発
声長Lのフレーム前に語頭も無音区間も検出され
ないならば、平均発声長Lのフレーム手前まで含
まれる、母音定常部中心iVj-pから処理中の母音
定常部中心{iVj}までをVCVマツチング区間と
して、母音定常部中心のすべての組合せ
{〔iVj-p、iVj〕〔iVj-p+1、iVj〕……〔iVj-1
iVj〕}の区間に対して特徴系列記憶部8bと
VCV標準パターン7bとの距離を、パタンマツ
シング手段9によつて計算し、さらに距離を母音
定常部中心間の距離{|iVj−iVj-p|、……、|
iVj-1、iVj|}とVCV標準パタン長|ωj|によ
つて正規化した上で最適なマツチング範囲と
VCV認識結果を決定する。第3図イ〜ハに前記
母音定常部中心〜母音定常部中心に対して、
VCV標準パタン7bとのパタンマツチングを行
う様子を示す。D1は標準パタンV1CV2と入力音
声との距離、D2、D3はそれぞれ標準パタン
V2CV3、V1CV3と入力音声との距離を示してい
る。さらに音声区間検出手段4よつて発声後“ヒ
バリが空に”の語尾4bが検出されると、総合制
御手段10は最終母音定常部中心iV7から語頭4
a方向に母音定常部中心をバツクトースする。つ
まり母音定常部中心iV7ではiV6が最適区間で認
識結果は“ANi”、同様に母音定常部中心iV6
iV5で“ORA”、母音定常部中心iV5では無音区間
終了iSEが最適範囲で認識結果は、“SO”、母音定
常部中心iV3はiV2で“ARi”母音定常部中心iV2
ではiV1で“iBA”、母音定常部中心iV1では語頭
4aが最適範囲で“Hi”が第2図ハに示すよう
に認識されたとすると、総合制御手段10は、認
識結果として、第2図ニに示すようにHiBARi
GA SORANi を出力する。
発明の効果 上記実施例より明らかなように本発明により連
続音声認識装置は認識処理は母音定常部中心毎に
行なうものとして、語頭および無音区間終了から
前もつて定めた平均発声長内の母音定常部中心と
はCV標準パタンとパタンマツチングして、CVと
音節を認識し、現在処理中の母音定常部中心から
前もつて定めた平均発声長逆昇つた範囲に、語頭
や無音区間終了が検出されない場合には、現在処
理中の母音定常部中心の範囲内のすべての母音定
常部中心の組合せに対して、VCV標準パタンと
パタンマツチングを行ない最適な範囲とVCV音
節を認識し、そして語尾が検出されると、すでに
検出された母音定常部中心をバツクトレースし
て、入力音声を最適なVCV音節とCV音節の系列
として認識することによつて簡単な構成で実時間
処理が可能で、かつ認識率の高い特徴がある。
【図面の簡単な説明】
第1図は本発明の一実施例における連続音声認
識装置のブロツク図、第2図および第3図はその
要部の処理過程を示す図である。 2……電力系列変換手段、3……特徴系列変換
手段、4……音声区間検出手段、5……無音区間
検出手段、6……母音定常部中心検出部、7……
標準パタン記憶部、8……記憶部、9……パタン
マツチング手段、10……総合制御手段。

Claims (1)

    【特許請求の範囲】
  1. 1 入力音声を特徴ベクトルの時系列パタンに変
    換する特徴系列変換手段、前記特徴ベクトルのフ
    レーム毎に母音識別と電力値計算を行い、電力値
    が一定の闘値以上である連続フレームと連続する
    母音系より母音定常部中心を検出する母音定常部
    中心検出手段、無音区間を電力値の闘値によつて
    検出する無音区間検出手段、日本語のCV(但しC
    は子音Vは母音)単音節とVCV音節を前記特徴
    ベクトルで記憶する音節パタン記憶手段、および
    前記母音定常部中心検出手段で検出した母音定常
    部中心毎に、前もつて記憶した平均発声フレーム
    長だけ逆昇つた範囲について、語頭もしくは前記
    無音区間検出手段によつて検出された無音区間が
    存在する場合には語頭もしくは無音区間終了から
    現在の母音定常部中心までの範囲について前記音
    節パタン記憶手段のCV音節パタンとパタンマツ
    チングを行い、語頭もしくは無音区間が存在しな
    い場合には、平均発声フレーム長逆昇つた範囲内
    に存在する母音定常部中心と現在の母音定常部中
    心の組合せの範囲について、VCV音節パタンマ
    ツチングを行つて最適区間を検出する手段を備
    え、語尾が検出されると、前記検出された母音定
    常部中心を語頭方向にバツクトレースして最適は
    VCV音節とCV音節の並びに決定して認識結果と
    して出力することを特徴とする連続音声認識装
    置。
JP58134598A 1983-07-22 1983-07-22 連続音声認識装置 Granted JPS6026400A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58134598A JPS6026400A (ja) 1983-07-22 1983-07-22 連続音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58134598A JPS6026400A (ja) 1983-07-22 1983-07-22 連続音声認識装置

Publications (2)

Publication Number Publication Date
JPS6026400A JPS6026400A (ja) 1985-02-09
JPH0449716B2 true JPH0449716B2 (ja) 1992-08-12

Family

ID=15132134

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58134598A Granted JPS6026400A (ja) 1983-07-22 1983-07-22 連続音声認識装置

Country Status (1)

Country Link
JP (1) JPS6026400A (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3460723B2 (ja) * 1992-05-19 2003-10-27 富士通株式会社 音声認識方式

Also Published As

Publication number Publication date
JPS6026400A (ja) 1985-02-09

Similar Documents

Publication Publication Date Title
JP3069531B2 (ja) 音声認識方法
JP3798530B2 (ja) 音声認識装置及び音声認識方法
JP3523382B2 (ja) 音声認識装置及び音声認識方法
JPS6138479B2 (ja)
JPH0449716B2 (ja)
JP3277579B2 (ja) 音声認識方法および装置
JP2813209B2 (ja) 大語彙音声認識装置
JPH0774960B2 (ja) テンプレ−ト連鎖モデルを使用するキ−ワ−ド認識方法およびシステム
JPS6027000A (ja) パタンマツチング方法
JP3110025B2 (ja) 発声変形検出装置
JPH10116093A (ja) 音声認識装置
JP2757356B2 (ja) 単語音声認識方法および装置
JPH0534677B2 (ja)
JP3125928B2 (ja) 音声認識装置
JPS59224900A (ja) 音声認識方法
JP2712586B2 (ja) 単語音声認識装置用パターンマッチング方式
JPH0449953B2 (ja)
JPS6250800A (ja) 音声認識装置
JPH05303391A (ja) 音声認識装置
JPH0640274B2 (ja) 音声認識装置
JPH0554117B2 (ja)
JPS63217399A (ja) 音声区間検出装置
JPH06324696A (ja) 音声認識装置及び方法
JPH0632006B2 (ja) 音声認識装置
JPS6039698A (ja) 音声認識方法