JPS6026400A - 連続音声認識装置 - Google Patents

連続音声認識装置

Info

Publication number
JPS6026400A
JPS6026400A JP58134598A JP13459883A JPS6026400A JP S6026400 A JPS6026400 A JP S6026400A JP 58134598 A JP58134598 A JP 58134598A JP 13459883 A JP13459883 A JP 13459883A JP S6026400 A JPS6026400 A JP S6026400A
Authority
JP
Japan
Prior art keywords
vowel
center
stationary part
syllable
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP58134598A
Other languages
English (en)
Other versions
JPH0449716B2 (ja
Inventor
三船 義照
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP58134598A priority Critical patent/JPS6026400A/ja
Publication of JPS6026400A publication Critical patent/JPS6026400A/ja
Publication of JPH0449716B2 publication Critical patent/JPH0449716B2/ja
Granted legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 産業上の利用分野 本発明は、日本語最小発声単位であるCV音節もしくは
VCV音節を前もって登録しておき、登録話者が発声し
た単語や文節および文章を認識する連続音声認識装置に
関する。
従来例の構成とその問題点 従来の連続音声認識装置として、フレーム毎に前もって
登録された音素パターン、例えば5@音IAI l i
 l lul IEI lo+、子音+811C11h
l、Iplltllkl、Ib1ldllcrl。
lmIInItrl等との距離を計算して音素識別し、
その距離を計算して音素識別し、その結果をマージ(例
えば連続音素は1音素に代表し、不連続音素は明り捨て
する等)処理して、認識結果とするものがあった。しか
しこの装置はその構成か簡(11−である反面、調合結
合等による音の変形が起るためにセグメンテーションが
あいまい(音韻区間が不明瞭)であるため認識率は著し
く低下する欠点があった。さらに認識率を向上させた連
続音声認識装置としては、CV音節を前もって標僧バタ
ンとして登録しておき、2段DP手法と呼ばれている、
個々の登録CV音節とは時間軸伸縮を行った上で、全体
として最適なCV音節系列を決定する、パターンマツチ
ング手法を用いて、音節系列として認識結果をめている
ものや、■C■音節も登録して同様な2段DP手法によ
って認識結果をめているものがあった。しかしこのよう
な2段DP手法を用いる装置では、実時間処理を行うた
めに美大な計算量を実行する専用ハードウェアを必要と
し、コスト低減が困難であった。また、種々の方法に比
べて認識率が優れているものの、2段DP手法に固有の
挿入、脱落誤り(例えば、2音節データを3音節として
マツチングして誤認識する、捷たは2音節データを1音
節としてマツチングして誤認識する)が発生することが
有り、対策処理が困難であるため認識率にも限界があっ
た。
発明の目的 本発明は上記従来の欠点を除去し、簡t、Itな構成で
実時間処理を可能にすると共に、高い認識率を実現した
連続音声認識装置を提供することを目的とする。
発明の構成 本発明による連続音声認識装置は入力音声を特徴ベクト
ルと電力の時系列に変換し、各フレーム毎の母音識別結
果から母音定常部中心と無音区間を検出し、語頭から最
終母音定常部中心(ivN)までの範囲において、語頭
および無音区間終了から前もって定められた平均発声速
度長(L)フレーム内の母音定常部中心までは、前もっ
て記憶CV 、p49 Kl、バタンとのバタンマツチ
ングによって言忍識を行ない、また無音区間を含まない
母音定常部中心から母音定常部中心の範囲においては、
母音定常部中心ごとに、現在の処理中母音定常部中心フ
レームから、前もって定められた平均発生速度長まで逆
昇った時点に含まれる母音定常部中心までを認識範囲と
して、現在の処理母音定常部中心とのすべての組合せの
区間に対して、前もって記憶した■1C■2標準バタン
とのバタンマツチングを行って最適区間と■1C■2 
J忍識結果を検出するようにし、前記無音区間のない母
音定常部中心から母音定常部中心の範囲においては、最
終母音定常部中心から最適区間を与える母音定常部中心
を検出し、その母音定常部中心からさらに同様な最適区
間を与える母音定常部中心を検出し、先頭の母音定常部
中心までたどり、各々のv1C■2系列とする。また語
頭および無音区間の終了フレームから直後の母音定常部
中心はCVil識結果全結果CV系列とする。そして前
記のCV系列と■1C■2系列をつなぎ合せたものを連
続認識結果とするものである。
実施例の説明 以下に本発明の実施例について説明する。
第1図において、1は入力端子より人力された信号をデ
ィジタル信号に変換するA/D変換器、2は電力系列変
換手段、3は入力信号を特徴ベクトルの時系列バタンに
変換する特徴系列変換手段である。4は入力音声の電力
系列によって長い無音を検出して音声区間を検出する音
声区間検出手段である。5は音声区間検出手段4によっ
て切り出される音声区間において電力系列によって短い
無音を検出して無音区間を検出する無音区間検出手段で
ある。6は入力音声のピーク電力を検出するピーク電力
検出手段6aと特徴ベクトル系列のベクトル毎に母音識
別を行う母音識別手段6bからなり、ピーク電力の前後
のフレームにおける母音識別結果の同一母音中心から、
母音定常部中心を検出する母音定常部中心検出部である
7は入力音声を特徴ベクトルの形でCV音節もしくは、
v1C■2音節の単位でそのベクトルを記憶する標/I
Iξパタ/記憶部、8は平均発声長Lフレーム分だけ、
IJ音認識結果の系列を記憶する母音系列記憶部8aと
特徴ベクトルの系列を記憶する特徴系列記す・3部8b
からなる記憶部である。9は特徴ベクトル記憶部8bに
おける語頭4aもしくは無音区間終了5bから直後の母
音定常部中心6Cまでの区間の場合にはCV標準パタン
7aとバタンマツチングを行い、平均発声長Lフレーム
以内の母音定常部中心6Cから母音定常部中心6Cの区
間の場合にはv1Cv2標準パタン7bとバタンマツチ
ングを行うバタンマツチング手段である。
10は音声区間検出手段4、無音区間検出手段6、++
]−音定常部中心検出部6、記憶部8およびバタンマツ
チング手段9を制御して、入力音声の母音定常部中心に
語頭や無音区間の情報を使用して、CV音節とv1CV
2音節とのバタンマツチング結果を接続して、CV音簡
のストリンゲスとして認識結果を出力する総合制御手段
である。12は音声認識動作中には端子12aに、標阜
パタン作成時には端子12bに接続される切換スイッチ
である。
次にこの実施例の動作を第2図および第3図とともに以
下に説明する。入力端子11に入力された音声信号はA
/D変換器1によりディジタル信号に変換され、電力系
列変換手段2に加えられる。
この手段2の出力の一例を第2図(イ)に示す。この波
形は入力音声が、1ヒバリが空に1と発声された場合の
ものである。その音声信号の語頭48〜語尾4bは、音
声区間検出手段4によって検出される。また一定の閾値
以上となる電力系列が一定フレーム長以上連続している
期間で、かつ川音識別手段6bによって識別された母音
が同一種類で一定フレーム長以上連続する場合に、ピー
ク電力検出手段6aによって母音系列の中心を検出する
その検出点を図中に zVl 、 IV2 、・・・・
l IV6として示し、ている。また母音系列が2種類
連続する場合には2重母音として各々の中心を検出する
そして上述した母音定常部中心が検出される毎に、その
前の母音定常部中心との間に無音区間が存在するか否か
を無音区間検出手段5によって検出して、i+(Kf区
間開始5a、終了” b(iSSl + 1SE1)(
l5S211SE2 ’)として検出する。上述した母
音定常部中心i、V ] が検出されると、 Z V 
] から平均発声長りのフレーム手前に、語頭4aもし
くは、フ11〔音区間終了5b(1SE111SE2)
が検出されているならば、語頭もしくは無音区間終了か
ら母音定常部中心 IV ] までの区間に対してCV
標桑ツクタン7aとバタンマツチング手段9によってマ
ツチングを行ない認識結果とする。母音定常部中心iV
、から平均発声長りのフレーム前に語頭も無音区間も検
出されないならば、平均発声長りのフレーム手前まで含
まれる、母音定常部中心I V J Pから処理中の母
音定常部中心(iV ] lまでをVCVマツチング区
間として、母音定常部中心のすべての組合せ(〔iV・
 1v・][iV・ 、 iV・〕]−P’ ] ]−
pl ] ・・・・・・・・(lv、 、 、 tV、 ’J l
の区間に対して特徴系列記憶部8bとVCV標qパター
ン7bとの距離を、バタンマツチング手段9によって計
算し、さらに距離を母音定常部中心間の距離(l IV
 ] l v、、 p−・−・+ l iV4−1 +
 ivl 1 )とVCV標準バタン長1ωj1によっ
て重焼化した上で最適なマノチンク範囲とVCV認識結
果を決定する。第3図(イ)〜(ハ)に前記母音定常部
中心〜母音定常部中心に対して、VCV4iiJパタン
7bとのバタンマツチングを行う様子を示す。Dlは標
僧パタン■1C■2と入力音声との距離、D2.D3ば
それぞれ標へ(バタン■2Cv3.■1C■3と入力音
声との距離を示している。さらに音声区間検出手段4に
よって発声語°“ヒバリが空に″の語尾4bが検出され
ると、総合制御手段1oは最終母音定常部中心lv7か
ら語頭4a方向に母音定常部中心をバックドースする。
つまり母音定常部中心lv7ではIV6か最適区間で3
忍識結果は’ ANi”’、同様に母音定常部中心iv
6はIV5 テ” ORA ”、母音定常部中心iV 
では無音区間終了iSEが最適範囲で認識結果は”so
”、母音定常部中心I V sはiV で“’ARi”
、母音定常部中心1■2では1V1 で” i BA 
”、母音定常部中心 iV1では語頭4aが最適範囲で
°“Hi ” が第2図(ハ)に示すように認識された
とすると、総合制御手段10は、認識結果として、第2
図に)に示すようにHiBARi GA、5ORANi
を出力する。
発明の効果 上記実施例より明らかなように本発明による連続?[↑
声認識装置は認識処理を母音定常部中心毎に行なうもの
として、語頭および無音区間終了から前もって定めた平
均発声長内の母音定常部中心とはCV標桑バタンとバタ
ンマツチングして、C■音節を認識し、現在処理中の母
音定常部中心から前もって定めた平均発声長内昇った範
囲に、語頭や無音区間終了が検出されない場合には、現
在処理中のIiJ音定常部中心の範囲内のすべての母音
定常部中心の組合せに対して、VCV標檗バタンとバタ
ンマツチングを行ない最適な範囲とVCV音節を認識し
、そして語尾が検出されると、すでに検出された母音定
常部中心をバックトレースして、入力音声を最適なVC
V音節とCV音節の系列として認識することによって簡
単な構成で実時間処理が可能で、かつ認識率の高い特徴
がある。
【図面の簡単な説明】
第1図は本発明の一実施例における連続音声認識装置の
ブロック図、第2図および第3図はその要部の処理過程
を示す図である。 2・・・・・・電力系列変換手段、3・・・・・・特徴
系列変換手段、4・・・・・・音声区間検出手段、5 
・・・・無音区間検出手段、6・・・・・・母音定常部
中心検出部、γ・・・・・標阜パタン記憶部、8・・・
・・・記憶部、9・・・・・・バタンマツチング手段、
10・・・・・・総合制御手段。

Claims (1)

    【特許請求の範囲】
  1. 入力音声を特徴ベクトルの時系列バタンにf換する特徴
    系列変換手段、前記特徴ベクトルのフレーム毎に母音識
    別と電力値計算を行い、電力値が一定の閾値以上である
    連続フレームと連続する母音系より同音定常部中心を検
    出する母音定常部中心検出手段、無音区間を電力値の閾
    値によって検出する無音区間検出手段、日本語のCV(
    但しCは子音■は母音)川音節とVCV音節を前記特徴
    ベクトルで記憶する音節バタン記憶手段、および前記母
    音定常部中心検出手段で検出した母音定常部中心筒に、
    前もって記憶した平均発声フレーム長だけ逆昇った範囲
    について、語頭もしくは前記無音区間検出手段によって
    検出された無音区間が存在する場合には語頭もしくは無
    音区間終了から現在の母音定常部中心までの範囲につい
    て前記音節バタン記憶手段のCV音節バタンとバタンマ
    ツチングを行い、語頭もしくは無音区間が存在しない場
    合には、平均発声フレーム長逆昇った範囲内に存在する
    母音定常部中心と現在の母音定常部中心の組合せの範囲
    について、■C■音節・くタンマツチングを行って最適
    区間を検出する手段を備え、語尾が検出されると、前記
    検出された母音定常部中心を語頭方向にバックトレース
    して最適なVCV音節とCV音節の並びを決定して認識
    結果として出力することを特徴とする一連続音声認識装
    置。
JP58134598A 1983-07-22 1983-07-22 連続音声認識装置 Granted JPS6026400A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58134598A JPS6026400A (ja) 1983-07-22 1983-07-22 連続音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58134598A JPS6026400A (ja) 1983-07-22 1983-07-22 連続音声認識装置

Publications (2)

Publication Number Publication Date
JPS6026400A true JPS6026400A (ja) 1985-02-09
JPH0449716B2 JPH0449716B2 (ja) 1992-08-12

Family

ID=15132134

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58134598A Granted JPS6026400A (ja) 1983-07-22 1983-07-22 連続音声認識装置

Country Status (1)

Country Link
JP (1) JPS6026400A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05323989A (ja) * 1992-05-19 1993-12-07 Fujitsu Ltd 音声認識方式

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05323989A (ja) * 1992-05-19 1993-12-07 Fujitsu Ltd 音声認識方式

Also Published As

Publication number Publication date
JPH0449716B2 (ja) 1992-08-12

Similar Documents

Publication Publication Date Title
JP3523382B2 (ja) 音声認識装置及び音声認識方法
JPS6138479B2 (ja)
JPS6026400A (ja) 連続音声認識装置
JPS6027000A (ja) パタンマツチング方法
JPH0774960B2 (ja) テンプレ−ト連鎖モデルを使用するキ−ワ−ド認識方法およびシステム
JP2943473B2 (ja) 音声認識方法
JP3125928B2 (ja) 音声認識装置
JPS63217399A (ja) 音声区間検出装置
JPS6250800A (ja) 音声認識装置
JPH0534677B2 (ja)
JPS61260299A (ja) 音声認識装置
JPH03145167A (ja) 音声認識方式
JPS59149400A (ja) 音声入力装置
JPS6312000A (ja) 音声認識装置
JPS63131196A (ja) 鼻子音識別装置
JPH0640274B2 (ja) 音声認識装置
JPS60170900A (ja) 音節音声標準パタン登録方式
JPS6078494A (ja) パタンマツチング装置
JPS62166400A (ja) 音声ワ−ドプロセツサ装置
JPS61200596A (ja) 連続音声認識装置
JPS6247100A (ja) 音声認識装置
JPH0449953B2 (ja)
JPS59180598A (ja) 音声入力方式
JPS61177000A (ja) 音声パタ−ン登録方式
KR20010054869A (ko) 음성인식을 위한 단어 모델링에서의 묵음 삽입 방법