JPS60182499A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPS60182499A
JPS60182499A JP59039228A JP3922884A JPS60182499A JP S60182499 A JPS60182499 A JP S60182499A JP 59039228 A JP59039228 A JP 59039228A JP 3922884 A JP3922884 A JP 3922884A JP S60182499 A JPS60182499 A JP S60182499A
Authority
JP
Japan
Prior art keywords
vowel
word
stationary
input
series
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP59039228A
Other languages
English (en)
Inventor
英一 坪香
樺澤 哲
三船 義照
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP59039228A priority Critical patent/JPS60182499A/ja
Publication of JPS60182499A publication Critical patent/JPS60182499A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 産業上の利用分野 本発明は音声認識装置に関する。
従来例の構成とその問題点 人間にとって最も自然な情報発生手段である音声が、人
間−機械系の入力手段として使用できれば、その効果は
非常に太きい。
従来、音声認識装置としては特定話者登録方式によるも
のが実用化されている。即ち、認識装置を使用しようと
する話者が、予め、認識すべきすべての単語を自分の声
で特徴ベクトルの系列に変換し単語辞書に標準パターン
とし、て登録してお・き、認識時に発声された音声を、
同様に特徴ベクトルの系列に変換し、前記単語辞1中の
との単語に最も近いかを予め定められた規則によって計
算し、最も類似している単語を認識結果とするものであ
る。
ところが、この方法によると、認識単語数が少いときは
良いが、数百、数千単語といったように増加してくると
、主として次の三つの問題が無視し得なくなる。
(1)登録時における話者の負担が著しく増大する0 (2)認識時に発声された音声と標準パターンとの類似
度あるいは距離を割算するのに要する時間が著しく増大
し、認識装置の応答速度が遅くなる。
(3) 前記単語辞書のために要するメモリが非常に犬
きくなる。
以上の欠点を回避するだめの方法として認識の単位を子
音(母音および母音の単音節(以後それぞれCV、Vで
表す。Cは子音、■は母音を意味する。)とする方法が
ある。即ち、標準パターンとして単音節を特徴ベクトル
の系列として登録しとして単音節を特徴ベクトルの系列
として登録しておき、認識時に特徴ベクトルの系列に変
換された入力音声を、前記単音節の標準パターンとマツ
チングすることにより、単音節の系列に変換するもので
ある。日本語の場合、単音節はだがだが101種類であ
り、単音節は仮名文字に対応しているから、この方法に
よれは、日本語の任意の単語あるいは文章を単音節列に
変換する(認識する)ことかでき、前記(1)〜(3)
の問題はすべて解決されることになる。しかし、この場
合の問題として調音結合と十グメンテー/ヨンがある。
調音結合は、音節を連続して発声すると各音節は前後の
音節の影響を受け、スペクトル構造が前後に接続される
音節によって変化する現象である。セグメンテーション
は、連続;−て発声された音声を単&節単位に区切るこ
とであるか、これを確実に行う決定的な方法は未だ見出
されていない。この2つの問題を解決するために、現在
のところ各単音節を区切って、発声することが行われて
おり、実用化さtlている装置もある。
第1図は単音節音声認識をパターンマツチングで行う装
置の一般的な構成である。1は音声信号の入力端子であ
る。2は特徴抽出部てあって、入力音声信号を、フィル
タバンクやPFT、LPCなどにより分析し、数ミリ秒
毎に特徴ベクトルの系列A−a1.a2 ・・a□・・
・・aI に変換する。3は標準パターン記憶部であっ
て予め認識すべき単音節音声を同様な手段によって特徴
ベクトルの系列に変換したものを各音節に対する標準パ
ターンRn−b?bn!b?・・・・・bYo(/コだ
し、n−1。
2、・・・・・、N:Nは標準パターンの数)として記
憶する部分である。4はパターン比較部であって、特徴
抽出部2の出力である入カバターンAと、標準パターン
記憶部3に記憶されている夫々の標準パターンRn を
比較し、両者の距離D(A、R”)を鐘出する。5は判
定部であって、n=argmin(D(A、Rn))に
より、入カバターンに最も近い△ 標準パターンRn を判定する。z = a r g、
m i n 17(z ) :1はfcZ)を最小にす
る2を2とするという意味である。6は判定結果を単音
節認識結果として出力する出力端子である。パターン比
較部4におけるパターン比較は、動的計画法を用いた所
謂DPマツチングや線形/フトマッチング等がよく用い
られる。また、先ず母音を認識して候補母音段を決定し
てから、その母音段に属する標準パターンを用いて子音
部を認識することにより、認識率とマツチングの速度を
向上させているのが一般的である0 しかし、単音節音声は、持続時間か短かく、「ン」、「
チ」等子音部の微妙な差によって区別しなけれはならな
いものが多く、単語音声のように高い認識率を得るのか
困難である。
この問題を解決するために、単語辞瞥を用いる方法が考
えられている。第2図はその例である。
同図において、第1図と同一の番号を付したブロックは
、第1図と同一の動作を行う。7は単語辞書で、認識づ
−ベき単語Wl(d:1 、2 、・−・、L: L(
徒登録単語数)が単音節に対応する記号列WJl’=S
l’S≦・・・・・・s(・・・・・・5Al(3Cは
単語vVlのに番目の音節)として記憶されている。8
V↓単語比較都であって、入力単音節列T−A1A2・
・・・・Am・・−・・へ(Mは入力単語の音節数)で
あるとき、入力単語の音節数に等しい音節数の単語辞書
7に記憶されテイル単語wl′−8l′Sl′l′l′
1 □・・・・sM(w は音節数M の単語)に対し、パターン比較部4で算出された距離D
(Am、S富′)から各l′についてを算出する。9は
判定部であって、 ヶ、、・オオゎJ、オえイや□、1オt、b。、。
△ は認識された単語を出力する出力端子である。
以上のように、単語辞書の知識を用いれば音節のみでな
くその組合せである単語全体としての妥当性を考慮する
ことになるので、認識率は向上する。またワードグロセ
ノサへの入力を考えるとき、前記単語辞書は仮名漢字変
換を行うための辞書を共用することができ、単語辞書は
音声認識用として特別に準備する必要はない〇 しかし、単語辞書の単語数は通常3万以」二にもおよび
、単語比較部8におけるb1算量が無視できなくなる。
 ゛ 前以て母音系列を認識して最終的に照合すべき単語を限
定することによってこの問題を解決する装置が特願昭5
8−143181号明細書に述へられている。
即ち、入力音声信号を特徴ベクトルの系列に変換する手
段と、入力音声信号を音節毎に区切る手段と、前記特徴
ベクトルの系列から前記各音節の後続母音を認識する手
段と、前記後続刊音列と同じ後続母14列を有する単語
あるいは文節の音節列を記号列として得る手段と、前記
記号列と前記入力音声信号から得られた音節列とをマツ
チング−]−る手段と、このマツチングの結果、前記入
力音声信号に最も近い前記単語あるいは文節を前記入力
音声に対応する認識結果と判定する判定手段とを備えた
音声認識装置である。
このようにすると、例えば、4音節の単語の場合、母音
の出現確率が等しいとすれば、ある特定の母音列の生ず
る確率は(115)’ =1 /625となり4音節の
単語が1万語あるとすれば、ある特定の母音列に対応す
る4音節語は16語となり、実際に比較計算をしなけれ
ばならない単語は激減する。余裕をみて、第2候補の初
音も勘定に入れるとしても(2/s )’ =、 1 
/39となり、同様に4音節の単語か1万語あるとすれ
ば、比較割算をずべき4音節語は256語となり、大幅
に減少する。さらに促音や撥音も上記母音同様に処理す
ることにすれは、さらに比較計算を減少させることがで
きる。これら母音や促音、撥音等の認識はほぼ完全に行
われるので、割算量の減少のみでなく認識率自体も向」
−ニする・以上の方法は、各単音節を離散的に(区切っ
て)発声する場合にはそのま1適用できるか、単音節の
離散発声により日本語の文章を入力するのは、話者によ
って緊張を強いるものであり、連続発声により入力でき
ることが望捷しい。
連続発声された場合でも、各単音節をその音声から分離
することができれば、前記の方法を適用度に行うのは大
変困難であり、未だ決定的な方法は見出されていないと
言える。
発明の目的 本発明は、単語または文節の単位で連続発声された音声
を認識する音声認識装置に関し、より詳細には、単語辞
書とのマツチングの速度を向上せしめることを目的とす
る。
発明の構成 本発明は、連続して発声された音節列に対しても、前記
従来例と同様に認識すべき単語を構成する各単音節の後
続fEt音列を先ず認識し、最終的にマツチングすべき
単語の剤補を絞り、認識処理の速度を上けると共に認識
率の向上も果さんとするものであって、入力音声信号を
特徴ベクトルの系列に変換する特徴抽出手段と、前記入
力音声信号の定常点を抽出する定常点抽出手段と、抽出
されたそれぞれの定常点を母音と見做して1.J音認識
を行う母音認識手段と、該手段によって得られた母音系
列と、単語辞書のマツチングずべき単Bb寸たけ文節を
構成する単音節の後続刊音列と前記Lす音系列との比較
を行い、両者の系列としての距離または類似度を算出す
る母音系列間距離算出手段と、その結果最も距離的に小
さくなる(類似度の大きくなる)母音系列を見出すへそ
共に前記定常点のうち各母音に対応する定常点を判定す
る母音定常部判定手段とこの母音系列に対応する各単語
または文節に対応するv 、 cv 、”vv 、 v
cv (vH母音、Cは子音)等の音節標準パターンの
結合と前記入カバターンとの距離を算出する単語間距離
計算手段と、入力音声信号を特徴ベクトルの系列に変換
する特徴抽出手段と、前記入力音声信号の定常点を抽出
する定常点抽出手段と、抽出されたそれぞれの定常点を
母音標準パターンと比較などして前記定常点の特徴ベク
トルの各標準パターンに対する距離または類似度を算出
する第1の距離算出手段と、この距離を基に単語辞書の
マツチングすべき単語または文節を構成する単音節の後
続母音列と、前記定常点の特徴ベクトル列との比較を行
い両者の系列としての距離または類似度を算出する第2
の距離算出手段と、その結果最も距離的に小さくなる(
類似度の大きくなる)母音系列を見出すと共に前記定常
点のうち各母音に対応する定常点を判定する母音定常部
判定手段と、この母音列に対応する各単語まだは文節に
対応する■。
CV 、 V V 、 V CV (Vidf8f、C
u 子iJ ) 等ノ音節標準パターンの結合と前記入
カバターンとの距離を算出する第3の距離算出手段と、
この第3の距離算出手段により算出される距離の最小値
(類似度の最大値)を与える該手段により算出される距
離の最小値(類似度の最大値)を与える単語寸たは文節
を認識結果として判定する判定手段とを含むものである
実施例の説明 以後、「単語」という言葉は「文節」という言葉も代表
するものとする。また、「類似度」(−i「距離」で説
明する。即ち、距離が最小とは類似度が最大ということ
である。
発声された単語音声からその単語を構成する各単音節の
境界を精度よく検出するのは大変困難であるが、本発明
の基本的な原理はスペクトルの定常な点の検出はほぼ確
実に行うことができ、各母音の中心フレームは必ずスペ
クトルの定常点付近にあるという事実を利用するところ
にある。
入力音声パターンにおいて定常となり得る点(フレーム
)は、母音、有声子音、摩擦子音その他であるが、各母
音の中心フレームは、はぼ確実にこの定常点に含まれて
いると見做して差支えはない。そこでどの定常点が母音
として最も妥当であるかを決定するには、単語辞書の各
単語に対応する3![される母音系列と前記定常点に対
応する特徴ベクトルを母音として認識した結果得られる
母音系列との距離を周知のDPマツチングによりめ、最
も距離的に小さい母音系列を入力単語音声の母音系列と
し、このとき得られるマツチング経路上で、前記母音系
列標準パターンのそれぞれの母音に対応する前記定常点
をその初音に対する定常点とすればよい。このようにす
ることによって、前記母音以外の定常点は排除され、入
カバターンに対する正しい母音系列を決定することがで
きる。
乙のようにして入カバターンに対応する母音系列が得ら
れると、単語を構成する単音節の後続母音の系列が前記
入カバターンに対応する母音系列に等しい単語が最終的
な認識候補単語として選はれるのであって、前記説明に
よりその数は大幅に減少する。この選ばれた単語につい
て次のようなマツチングを行う。
いま、入カバターンに対応する母音の系列がvl、■2
・・・vMであるとする。このとき、マツチングすべき
単語はW”−c4 v1c4 V2・・・・C△”Mで
ある。たたしC譬は、第λ単語を構成する第1番の単音
節の子音であって、c4v1が単母音の場合i’l: 
CY V4−V、 、 −471,y、CQ、、V t
 +1力2M m 音の場合はv、c’? v、−v、
v、1で表現するものと1 1+1 1+1 する。このとき、入カバターンと単語W”とのマツチン
グは次のようにして行うことができる。即ち、前記の如
くしてめられたi番目の母音中心フレームから1+1番
目の母音中心フレームの入カバターンの部分パターンを
A(i、i+1)(たたしA(o、1)は語頭から1番
目の定常点までの入カバターンの部分パターンとする)
、前記g番目の単語幅の1番目の母音を先行母音とし、
i+1番目の母音を後続母音とし、i番目とi+1番目
の母音で挾剪れる子音CL1 を先行母音と後続母音で
侠壕れる子音とするVCV音節標準パターンをBQ(i
 、 i+1 ) (ただし、B(o、1)は前記単語
の1番目のcv−または■音節標準パターンとする)と
し、前記部分パターンA(i、i+1)と前記標準パタ
ーンB’(i 、 i+1 )との距離をD (A(i
 、 i+1 )、Bλ(i、i+1))とすれば、入
カバターンTと単語W”の距離Dw(T、W′りをDw
(T、W”)−ΣD(A(i、i+1)、B’(i、i
+1))−0 で定義し、 n=argmin CDW(T、W”) 〕をめ、単語
W”を認識結果とするものである。
ここで、D(A(i、i+1)、B(i、i+1))は
入カバターンの部分パターンと各音節を構成する特徴ベ
クトルの系列同志の距離として周知のDPマツチングに
より計算される。
以上の原理に基づく本発明の一実施例を図面と共に説明
する。
第3図は本発明の一実施例を示すブロック図である。1
は音声信号の入力端子、2は削離せる如き特徴抽出部で
あって、例えば20チヤネルのフィルタバンクを用い、
1フレームヲ10 m5ec 、!:ずれば、その出力
には10m5ec毎に20個の数値(特徴ベクトル)が
得られる。3は振幅正規化部であって、入力音声信号の
レベル変動の影響を除去するために、前記特徴ベクトル
の絶体値を一定の値にする為のものである。例えは入力
の第1フレームがa、−(a 、a 、・・・・・、a
 )でアルドl il i2 tn すれば、正規化後のベクトル80′は 7/ ail ai2 ain al−(l +””” l )等とすることがKK K できる。4は定常点抽出部であって、入力の特徴ベクト
ルの系列から入力音声信号のスペクトルの定常なフレー
ムを抽出するものである。これはフをめ、この分散 レーム毎に前後数フレームのスペクトルの分散が極小に
なるフレームとして検出できる。即ち、各フレームに対
し前後Nフレームについて分散σ1′をめる場合は、第
1フレームの特徴ベクトルを前記1□ とすれば、 のように定義することができる。
5は母音標準パターン記憶部であって、各母音(撥音も
含む)に対応する特徴ベクトル(スペクトル)が記憶さ
れている。これは予め話者が発声した母音音声に特徴抽
出部2及び振幅正規化部3での処理を施した後、その定
常部の特徴ベクトルを抽出したものである。6は母音認
識部であって、入力音声パターンのそれぞれの定常フレ
ームの特徴ベクトルと前記それぞれの母音標準パターン
の特徴ベクトルとのベクトル間距離を計算し、その最小
値を与える母音を母音認識結果として記憶する。ベクト
ル間距離としては周知のユークリッド距離、市街地距離
等が使用され得る。第4図はこの母音認識の様子を示し
ている。石、46は母音/a/〜/N/に対応する特徴
ベクトル、1〜fは入力音声の定常点に対し語頭側から
順次付された番号、d(ly])は母音標準パターンb
、と第1番の定常フレームの特徴ベクトルとのベクトル
間距離であって、例えは、定常点1の欄においてd(1
,3)が最小であれば定常点1は/u/と認識される。
7は母音系列辞書であって、単語辞書を構成する各単語
の単音節の後続母音の系列が記憶されている。例えば、
「オオサカ」「トヨナカ」「ヨコハマ」等の単語に対す
る母音系列は10// 0// 、// a /である
。8は前記母音系列と前記定常フレームに対応する母音
系列との距離をDPマツチングによりめる母音系列間距
離計算部である。第6図はその様子を説明する図であっ
て、bは「ヨコハマ」と発声した場合の電力波形と各音
韻との対応を示し、「。」は定常点を示している。この
例では母音部は必ず定常となっており有声子音/m/も
定常点となっており、母音として、例えば/u/として
認識されている。aはこの定常点ベクトル系列と母音系
列10/10.///a//a/とのマツチングの様子
を示す格子グラフである。
CはDPマツチングを行う際のマツチング経路の拘束条
件の例を示す。マツチング経路の荷重和が入カバターン
の定常点数のみに依存するようにすれば、(イ)に対す
る漸化式は 初期値 q(1,1)−d′(1,1)(ロ)に対する
順化式 %式%(1) で表わされる。”(i+ ] )は入力音声の第i定常
点の母音認識結果をv4.マツチングすべき母音系列辞
書7の母音系列の第】母音をV・ とすると】 き、vl に対応する特徴ベクトルbv□とv、に対応
する特徴ベクトルbv との距離として定義できる。
】 あるいは簡単には、y、−v、のときd’ (i 、 
j )=1゜■、\v、のときはd’(i 、 i )
−〇と定義できる。
(イ)は入力音声の定常点が最大2つ連続して飛ばして
マツチングされ得ることを意味し、(ロ)はさらに、標
準パターンの特徴ベクトルが一つ飛はしてマツチングさ
れ得ることを意味している。即ち、(イ)は母音でない
定常点が最大2つ連続して挿入される場合を許し、(ロ
)は加つるに母音として検出されるべき定常点が1つ脱
落する場合を許すということである。また、前記漸化式
において、q(l+1)は格子点(i、i)までの始点
(1,1)からの最適の(cr(i、i)の最小値を与
える)マツチング経路に沿う累積距離である。(イ)2
(ロ)は単に経路制限条件の一例に過ぎず、他にも種々
溝えられ得るのであって、本例は本発明を限定するもの
ではない。
結局、前記定常点母音系列と母音辞書の母音系列との距
離は、定常点の数を工、マツチングする母音系列の母音
数を■とするとq(I、I)で与えられる。
aは[−ヨコハマ」と発声した入力音声の定常点列と母
音系列10〃0〃d//a/をマツチングする場合の一
例であって、(100)は選ばれた経路で、有声子音/
m/の飛ばされている様子が示されている。この経路が
まれば、入力音声の各定常点が如何なる母音と見做すべ
きか決定できる。
9は以上のようにしてめられた各母音列に対するq (
’ + J )のうち最小値を与える母音列を判定し記
憶する母音系列判定・記憶部である。10は判定された
母音系列に対応して入力音声の定常フレームの位置を記
憶する母音定常フレーム記憶部である。11は単語辞書
であって認識すべき単語が記憶されている。12は電力
言」鼻部であって、入力音声信号の電力をめる。13は
音声区間検出部であって、入力音声電力の大きさから入
力単語音声の始端、終端を検出する。14はバッファメ
モリであって振幅正規化部3で振幅正規化された入力音
声パターンを前記音声区間検出部13の出力に従って前
記始端から終端まで一時的に記憶する。15は音節標準
パターン記憶部であって、V、CVについては語頭から
後続母音の定常部捷で、vv、vcvについては先行母
音の定常部か後続母音の定常部まで、それぞれ対応する
特徴ベクトルの系列を記憶している。この特徴ベク]・
ルは予め話者の発声したv 、cv 、vv 、vcv
音声に特徴抽出部2、振幅正規化部3で行うのと同様な
処理を行って得られたものである。16は単語辞書11
で指定される前記音節標準パターンのそれぞれと、バッ
フツメモリ14の入力音声パターンとのDPマツチング
を、母音定常部記憶部10に記憶されている入力音声パ
ターンのフレームを始端あるいは終端としてマツチング
する単語間距離言1算部である。即ち、前記10/10
乙/a//a/の母音系列に対しては「オオサカ」「ヨ
コハマ」[トヨナカJ等の単語とマツチングすることに
なるが、例えは、「ヨコハマ」とマツチングするときは
、音節標準パターン記憶部15に対しては、/y o/
/ o k o /10 h a//a m a /な
る音節に対する標準パターンが選択され、バッファメモ
リ14の出力の始端から第1の定常点捷では/yO/の
標準パターンと、第1の定常点から第2の定常点捷ては
10 k o /の標準パターンと、第2の定常点から
第3の定常点までは10 h a /の標準パターンと
、第3の定常点から第4の定常点までは/ama/の標
準パターンとマツチングすることになる。第6図はこの
様子を例示するものである・aは入カバターンの定常点
から定常点までと、標準パターンとのマツチングの様子
を示しており、横軸は入カバターン、縦軸は標準パター
ンである。101 id、入カバターンの電力を示し、
100は標準パターンの電力を示す。
102.103は入カバターンの定常点を示す。前記「
ヨコハマ」とマツチングする例では、102を第2の定
常点、103を第3の定常点とすれば、100は10 
h a /に対する標準パターンということになる。1
04はマツチング経路である。bはマツチング経路の拘
束条件の例である経路上に示した数字はその経路に沿う
重みであり本例では荷重和ハマノチングスヘキ入カバタ
ーンのフレーム数にのみ依存する。本例の場合対応する
i’#i化式は次のようになる。
D(A(i 、i+j )、Bl(i 、i+1))−
gn(P、On)だたし、A(i 、i+l )、Bl
(i 、i+l )は前記記法に従い、pは入カバター
ンの部分パター−/八(i、i+1)の定常点1のフレ
ームを1とするときのフレーム番号、qは標準パターン
B’(i、i+1)のフレーム番号、PはA(i、i+
1)のフレーム数。
QnハB”(i 、i +1) ノア L’−ムi 、
 n(dB’(i、i+1)に対応する標準パターンの
番号+ ”(p + q )はA(i、i+1)の第p
フレームの特徴ベクトルと、Bl(i、i→−1)の第
qフレームの特徴ベクトルとのベクトル間距離である。
・ここに示した順化式も一例にすぎず、他にも種々考え
られるのであり、本セ明を限定するものではない。この
ように入カッ゛ターンの隔り合う定常点間でめられた距
離D(A(i、i+1)、IEX(i、i+1)から単
語VVlに対する入力パターンTの距離 がめられる。17は判定部であって、以上の如をめ、W
仝を認識結果とするものである。、8は出力端子である
。次に語中に促音を含む場合について説明する。
音声区間検出部13は、音声区間を検出すると共に促音
の検出も行う。即ち、無音か例えは250rngec以
上続けQま入力音声が終了したと見做し、無音区間か1
00 m5ec 〜260 m5ecのときは促音と見
做すことかできる。促音を検出することによって、マツ
チングすべき単語辞膚の単語をさらに限定することがで
き、信頼性および処理速度の向上をはかることができる
。即ち、母音系列辞書は促音を含んだ形で構成されてお
り、促音が検器音列として選ばれる。母音系列判定記憶
部9では促音を含んだ形で最適にマツチングされる母音
系列が記憶される。従って、単語辞書11における単語
は、促音を含んだ形でのf:J音系列で限定される単語
が最終的にDPマツチング部16てマツチングされる対
象となる単語として選はれろ。単語間距離刷算都16で
は、促音か検出される毎に語頭あるいは一つ前の促音終
了後のフレームからのDPマツチングを行う。第7図は
その具体例てあって、発声した音声の電力波形を示ず。
20Qは語頭、201は第1の定常点、202は促音の
開始、203は促音の終了、204は第2の定常点、2
06−1第3の定鹿点、206は語尾のそれぞれフレー
ムである。この場合、fit音系列141定記憶部9に
は前記説明に従って、/a、//Q、/10//u/が
記憶されているものとす/、)(/Q/は促音を・示す
記号)。このとき単語辞111で選はれる単語は「ザノ
トつ」「ナットク」等である。
「サソトウ」とマツチングする場合は、20Q〜201
の入カバターンと/sa/に対応する標準バタ=ンとの
マツチング距離と、203〜204の入カバターンと/
lO,/に対応する標準パターンとのマツチング距離と
、2o4〜205の入カバターンと10to/に対応す
る標準パターンとのマツチング距離の和を以て、単語「
す、トつ」と入力音声パターンとのマツチング距離とす
る・促音の検出を行うと共に無音を検出して、この無音
に対しても促音に対して行ったのと同様の処理を行うこ
ともできる。即ち、無音、有音の判定の為の闇値を適当
に選べば、無声破裂音/p//l//に/の前には必ず
無音となるようにすることかできる。このようにすれば
さらに単語を限定することができる。例えば、前記の例
において、207〜208が無音であって、促音でない
(例えば無音区間が100 m5ep以下)であるとす
れは、その直後は無声破裂音として単語「サノトウ」は
マツチングの対象から排除される。マツチングは無音か
ら無音まで個々に行われ、マツチング距離はその総和と
なる。例えば、本例の場合、単語「ナットク」はマツチ
ングの対象単語であるが、この単語とマツチングする場
合は、入カパクーンの200〜201と/na/に対応
する標準パターン。
入カバターンの203〜204と/lO/に対応する標
準パターン、入カバターン208−205と/k u/
に対応する標準パターンとのそれぞれのマツチング距離
の和を以て単語「ナノトク」と入力音声パターンとのマ
ツチング距離とすれは良い。
さらに、例えば無声摩擦音の検出等より多くの、各単語
についての属性を検出すれは、マツチングすべき候補単
語をさらに限定でき、処理速度の向上、認識率の改善等
か可能である。これをなすには第3図において単語特徴
抽出部19をイ附加すればよい。例えは無声摩擦音を抽
出することにずれは、前記の例のように母音列か/a/
/Q///′o、//u/で語頭と10〃o/の間に摩
擦音/係/かあることを単語特徴抽出部19が検出した
とずれば、Iυ音系列判定記憶部9には/チ// a 
//Q/1%/10//u/ iる系列が記憶され、単
語辞書からは「ザラソウ」等の単語が選ばれることにな
り、「ザノ、hつ」「ナソトク」等はマツチングの対象
から除かわ2る。
なお、本実施例では、母音系列を一つのみ選ぶようにし
て説明したが、母音認識部6における母音の認識誤りに
対処するため、母音の認識結果も−通りでなく、第n候
補捷で選ぶこともできる。
寸だ、ffJ、−6−系列の判定も、最適のもののみで
なく、複数候補選ぶことができるのは勿論である。
発明の効果 本発明によれば、単音節を連続して発声した場合でも、
母音定常部を適切に抽出することにより比較照合すべき
単語と音節標準パターンを限定することができ、認識率
、照合速度において大幅な改善が得られたものである。
【図面の簡単な説明】
第1図は従来のヰ音節音声認識装置を示すブロック図、
第2図は前記従来例を改良した例を示すブロック図、第
3図は本発明の一実施例における音声認識装置を示すブ
ロック図、第4図〜第7図は本発明装置の一部の動作を
説明する説明図であ1・・・・・音声信号入力端子、2
・・ 特徴抽出部、3 ・・振幅正規化部、4・・・・
定常点抽出部、5・・・・・・母音標準バタ〜ン記憶部
、6・・母音認識部、7・・・・・・母音系列辞1.8
・・・・DPマツチング部、9・・・・・・母音系列判
定記憶部、10・・・母音定常部記憶部、11・・・・
・単語辞書、12−・電力割算部、13・・・・・・音
声区間検出部、14 ・・・バッファメモリ、16・・
・音節標準パターン記憶部、16・・・DPマツチング
部、17−・・・判定部、18 ・・認識結果出力端子
、19・・・・・単語4も徴抽出部。 代理人の氏名 弁理士 中 尾 敏 男 ほか1名第1
N 3 第4C/」 lイノ (旬 第6N V Cν (Q+ tb+ 第 7 図

Claims (1)

    【特許請求の範囲】
  1. 入力音声信号を特徴ベクトルの系列に変換する特徴抽出
    手段と、前記入力音声信号の定常点を抽出する定常点抽
    出手段と、抽出されたそれぞれの前記定常点を母音と見
    做して母音認識を行う母音認識手段と、前記母音認識手
    段によって得られた母音系列と、単語辞書のマツチング
    すべき単語寸たは文節を構成する単音節の後続母音列と
    の比較を行い、両者の系列としての距離まだは類似度を
    算出する母音系列間距離算出手段と、前記母音系列間距
    離算出手段による算出の結果量も距離的に小さくなる(
    類似度の大きくなる)母音系列を見出すと共に前記定常
    点のうち各母音に対応する定常点を判定する母音定常部
    判定手段と、前記母音定常部判定手段で判定した母音系
    列に対応する各単語または文節に対応するV 、 CV
     、VV 、VCV(Vは母音、Cは子音)等の音節標
    準パターンの結合と前記入カバターンとの距離を算出す
    る単語間距離計算手段と、前記単語間距離計算手段手段
    により算出される距離の最小値(類似度の最大値)を与
    える単語捷たは文節を認識結果として判定する判定手段
    とを有することを特徴とする音声認識装置。
JP59039228A 1984-02-29 1984-02-29 音声認識装置 Pending JPS60182499A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59039228A JPS60182499A (ja) 1984-02-29 1984-02-29 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59039228A JPS60182499A (ja) 1984-02-29 1984-02-29 音声認識装置

Publications (1)

Publication Number Publication Date
JPS60182499A true JPS60182499A (ja) 1985-09-18

Family

ID=12547266

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59039228A Pending JPS60182499A (ja) 1984-02-29 1984-02-29 音声認識装置

Country Status (1)

Country Link
JP (1) JPS60182499A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0296067A (ja) * 1988-10-03 1990-04-06 Sekisui Chem Co Ltd 音声操作式電子錠
JPH0296068A (ja) * 1988-10-03 1990-04-06 Sekisui Chem Co Ltd 音声操作式電子錠

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60150098A (ja) * 1984-01-18 1985-08-07 松下電器産業株式会社 音声認識装置
JPS60164800A (ja) * 1984-02-07 1985-08-27 松下電器産業株式会社 音声認識装置
JPH045398A (ja) * 1990-04-20 1992-01-09 Okumura Mach Corp シールド掘削機のカッター板

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60150098A (ja) * 1984-01-18 1985-08-07 松下電器産業株式会社 音声認識装置
JPS60164800A (ja) * 1984-02-07 1985-08-27 松下電器産業株式会社 音声認識装置
JPH045398A (ja) * 1990-04-20 1992-01-09 Okumura Mach Corp シールド掘削機のカッター板

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0296067A (ja) * 1988-10-03 1990-04-06 Sekisui Chem Co Ltd 音声操作式電子錠
JPH0296068A (ja) * 1988-10-03 1990-04-06 Sekisui Chem Co Ltd 音声操作式電子錠

Similar Documents

Publication Publication Date Title
JPS60182499A (ja) 音声認識装置
JPS6180298A (ja) 音声認識装置
JP3277522B2 (ja) 音声認識方法
JPH0827640B2 (ja) 音声認識装置
JP2737122B2 (ja) 音声辞書作成装置
JP3291073B2 (ja) 音声認識方式
JP2760096B2 (ja) 音声認識方式
JPH067359B2 (ja) 音声認識装置
JPH0247757B2 (ja)
Watanabe Segmentation-free syllable recognition in continuously spoken Japanese
JPH0585918B2 (ja)
JPH0566596B2 (ja)
JPS59173884A (ja) パタ−ン比較装置
JPH045398B2 (ja)
JPH0719159B2 (ja) 音声認識装置
JPS6312000A (ja) 音声認識装置
JPH01126694A (ja) 音声認識装置における音韻記号の付加方式
JPS607492A (ja) 単音節音声認識方式
JPH0289098A (ja) 音節パターン切り出し装置
JPS62218997A (ja) 単語音声認識装置
JPS6355599A (ja) 音声認識装置
JPH05241592A (ja) 連続単語認識装置
JPS60147794A (ja) 単語音声認識方法
JPS60202487A (ja) 単語音声認識方法
JPS6120998A (ja) 音声認識装置