JPS5858598A - 音声認識方式 - Google Patents

音声認識方式

Info

Publication number
JPS5858598A
JPS5858598A JP56156281A JP15628181A JPS5858598A JP S5858598 A JPS5858598 A JP S5858598A JP 56156281 A JP56156281 A JP 56156281A JP 15628181 A JP15628181 A JP 15628181A JP S5858598 A JPS5858598 A JP S5858598A
Authority
JP
Japan
Prior art keywords
standard
matching
partial
input
baton
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP56156281A
Other languages
English (en)
Inventor
浅川 吉章
小松 昭男
市川 「あ」
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP56156281A priority Critical patent/JPS5858598A/ja
Publication of JPS5858598A publication Critical patent/JPS5858598A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 本発明は、音声認識方式、とくにバタンマツチング法を
用いた音声認識方式に関するものである。
音声認識の対象の中には、例えば「KanagawaJ
とl” KanazawaJ  の例のように、類似し
たものを含む場合も多く、両者間の誤りが増大するとい
った問題がある。これに対する対策として、ミニマック
ス(又はマックスミニ)による判定に基づく動的計画法
によるバタンマツチング法(%開昭47−:30242
号公報参照)が提案されている。この方法は、動的計画
法を用いて、入力バタンと標準パタンを最も良く整合す
るよう時間軸を伸縮さ価゛しようというものであり、上
記の例ではrgJと「z」の不一致の部分が強調されて
、両者の相違が評価される。しかしこの方法は、全体的
一致の度合の評価が欠ける点や、入力の一部に雑音など
が乗った場合に、その部分が評価されるという不安定要
因を持っている。
本発明は上記した問題点を教養すると共に、音韻を単位
とする認識方式の改良にも適用できる音声認識方式を提
供することを目的きしている。
上船の目的を達成するために、本発明でi標準とすべき
バタンを複数個の部分パタンに分銅し、入力バタンに対
し各部分バタンか一定の条件でマツチングした時に、そ
の標準バタンと同一カデゴリの入力があったと判定する
ものである。これによって全体としてのマツチング結果
が、その一部が非常に似ているために、一定以上の程度
に類似していても、ある部分が一定条件を満たさない場
合(部分が本質的に異なる場合)は異なるバタンとして
判定する。また、部分バタンは元の標準バタンを時間的
に分割したものであり、そのマツチング結果は入力バタ
ンの時間構造をも反映している。類似の程度が一定条件
を満たしている場合でも、時間構造が一定条件を満たさ
ない場合には、異なるバタンとして判定する。このよう
に(音響的)類似度と時間構造とによって、類似したバ
タンでも安定に判定することができる。
また、各部分バタンも一定の長さを持っているので、ノ
イズの影餐を受けに<<、安定な判別が可能である。
たとえば半母音/Y/をgRする場合を考えると、半母
音/y/は音響的には母音/i/や/e/と非常に良く
似ているが、母音/i/に近い特徴から始まり、次に続
く母音までの音響的特徴の時間変化が/y/とじての情
報を与えるという特徴を持っているから、この時間変化
の速さは発話速度にかかわらず比較的安定である。
音声の特徴を、たとえばlQms毎(以下、フレームと
呼ぶ)の出力値; X 、 w (z 、 、 X 2
・・・・・・、X、)で表わすことにしよう(音声の特
徴としてはその他機々なパラメータがあるが、そのどれ
を用いるか′は本発明にとって本質的でないことはいう
までもない)。
さらに、本発明者らの実験的検討によれば、フレーム長
を10m5としたとき半母音/y/は約lOフレームの
区間にわたって発声速度に関係なくほぼ一定の割合で変
化する。そこで半母音/y/の始点から後続の母音に向
かって107レームの区間を半母音の標準バタンとし、
その10フレームを1フレームづつ重なる4フレームか
らなる部分標準バタン3個に分割し、この10フレーム
からなる全体標準バタンと3個の部分標準バタンを各々
独立の標準バタンと見なして、入力音声と連続的にマツ
チングをとって行くことにより半母音/X/のi!識が
おこなえる。
入力バタンの一部と各標準バタンをマツチングさせる手
法としては、間代の連続DP法(特開昭55−2205
号公報参照)や、本発明者らがすでに出願した方法(特
願昭55−158297号参照)を用いることが出来る
以下、本発明を実施例を参照して詳細に説明する。第1
図は本発明を用いた音声認識装置のブロック構成図で、
これにより連続音声中の半母音/Y/を認識する手順に
ついて説明する。
第1図において、入力音声lはフィルタ・バンクからな
る音声分析部2により10m5毎に特徴パラメータに変
換され、マツチング部3−113−2、・・・・・・、
3−nに加えられて、全体標準バタンメモリ4−1と、
部分標準バタンメモリ4−2、・・・・・・4−nに格
納されている標準バタンと入力音声との類似の程度を連
続的に評価し、その結果を判定部5に送り出して行く。
第2図は入力音声に半母音/Y/を持つ音節/y a/
を含んでいる場合に半母音/y/の標準バタンにおける
全体標準バタンA(すなわち、/y/)、部分標醜パタ
ンPI、P2およびP3の各々が入力音声と類似の程度
が最も高くなるているため、最も値が小さくなる)点の
相互関係の一例を示している。
第2図によると入力音声はA%  P 1 s P 2
、P3のいずれにもほぼ同程度に類似しており、かつP
L、P2.P3がほぼ等間隔でマツチングしていること
を示しているので、入力音声は/Y/と判明する。これ
に対し第3図は、半母音/X/とよく似た母音/i/を
入力音声とするときの標準バタン/Y/によける上再己
A、PI、P2、P3との類似の程度が最も高い点の相
互関係の一例である。両者の比較から明らかなように、
入力音声に/Ya/を含む第2図の場合に対しては、A
、 PI、P2、P3の値は比較的安定しているのに対
し。
入力音声が/i/である第3図の場合に対しては、Aの
値が入力音声と/Y/との全体としての類似度の高いこ
とを示しているにもかかわらず、PI。
P2、jlは相当ばらついていることがわかる。
特にPlが非常に高い類似性を示しているため、全体標
準バタンであるAとの類似性も高い結果となっているが
、P3が明らかに相異していることを示しており、入力
音声と標準バタンの音響的特徴、時間的構造が異ってい
ることが明らかであり、入力音声は/y/でないことが
判明する。
つぎに、具体的な判定手順を説明する。
第2図及び第3図のように、各標準パタンの距離が最小
となった時点を10.11,1..13.その時の距離
をd。+dt+dz+d3とする。判定式の一例は次の
ようなものである。
θ1〜θ、は実験的に定める閾値、 (11は全体標準バタンの類似性と、部分標準バタンの
音響的特性に関する条件、 (2)は時間構造に関する条件である。(11、(21
を全と満たすとき、半母音/Y/と判定すればよい。
又は、上記条件を一次元化して、新しい距離りを定義す
る。
D−(d0+σ)(t+w)      (3)ここに 2(t3−11) 具体的に数値を示すと、第2図の例ではdo−0,8D
−1,05 第3図の例では 60口1.I        D−2,20となり、d
oよりもDの方が差が拡大する。Dの判定閾値をたとえ
ばθD−1,5と定め、D〈θ9 ならば半母音/Y/
と判定すればよい。
また[KanagawaJ  と[Kanazawa 
Jのような単語単位の認識に本発明を適用する場合には
、例えば部分標準パタンをQl =/Ka/ 、 Q2
=/a n a/ 。
Q3−/a g a/ 、 Q4−/awa/、!: 
R1−/Ka/ 。
R2=/ana/、B3w/aza/、R4−/awa
/として、マツチング手段に間代の連続DP法を用いれ
ば良い。第4図に[Kanagawa J 、第5図に
「Kanagawa Jという入力音声に対する「Ka
nagawaJの部分標準パタン(Q1tQ2゜Q3 
、 Q4 )と[Kanazawa Jの部分標準パp
7(R1,R2,R3,R4)のマツチングの一例を示
す。
全体標準パタンによるマツチングにはあまり差が出ない
場合であるが、Q3−/aga/とR3−/aza/の
部分標準パタンによるマツチングには顕著な差が現われ
ている。このように全体標準パタンのマツチングの他に
、部分標準パタンの相互関係を判定することによって、
「Kanagawa Jと[Kanazawa Jを安
定−こ判断することが出来る。
なお、第1図ではマツチング部と標準バタンメモリ部を
別個lと示したが、マツチング部を時分割的に使用し、
メモリを一体にまとめることが出来ることは言うまでも
ない。判定部5にはマイクロプロサ、すを用いることが
できる。
以上説明したように、本発明によれば全体標準パタンの
マツチング結果の他に、部分標準パタンのマツチング結
果の相互関係をも利用することによって、音響的特徴、
時間的構造の差を安定に検出出来るので、類似したバタ
ンの判別に効果がある。
【図面の簡単な説明】
第1図は本発明を用いた音声認識装置のブロック構成図
、第2図と第3図は半母音/y/の全体標準パタンと部
分標準パタンとのマツチング結果の一例を示す図、第4
図と第5図は単語音声の部分バタンマツチング結果の一
例を示す図である。 2:音声分析部、5:判定部 感 i n ネ 2 目 毛 3 旧

Claims (1)

    【特許請求の範囲】
  1. バタンマツチング法にもとづく音声認識方式において、
    標準パタンを複数個の部分標準パタンに分割し、入力バ
    タンと上記標準バタンおよび上記部分標準パタンとをそ
    れぞれ独立にマツチングさせた結果を所定の判定基準と
    比較することにより入力バタンの認識をおこなうことを
    特徴とする音声認識方式。
JP56156281A 1981-10-02 1981-10-02 音声認識方式 Pending JPS5858598A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP56156281A JPS5858598A (ja) 1981-10-02 1981-10-02 音声認識方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP56156281A JPS5858598A (ja) 1981-10-02 1981-10-02 音声認識方式

Publications (1)

Publication Number Publication Date
JPS5858598A true JPS5858598A (ja) 1983-04-07

Family

ID=15624386

Family Applications (1)

Application Number Title Priority Date Filing Date
JP56156281A Pending JPS5858598A (ja) 1981-10-02 1981-10-02 音声認識方式

Country Status (1)

Country Link
JP (1) JPS5858598A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58179899A (ja) * 1982-04-16 1983-10-21 株式会社日立製作所 パタ−ン・マツチング装置
JPH0618197A (ja) * 1990-06-25 1994-01-25 Soc Natl Poudres Explosifs 可燃筒を備えカートリッジケースメンバー及び該メンバーを組み入れた半可燃カートリッジケースを備えた弾薬、並びに該弾薬を充填する方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58179899A (ja) * 1982-04-16 1983-10-21 株式会社日立製作所 パタ−ン・マツチング装置
JPH0421879B2 (ja) * 1982-04-16 1992-04-14 Hitachi Seisakusho Kk
JPH0618197A (ja) * 1990-06-25 1994-01-25 Soc Natl Poudres Explosifs 可燃筒を備えカートリッジケースメンバー及び該メンバーを組み入れた半可燃カートリッジケースを備えた弾薬、並びに該弾薬を充填する方法
JPH081360B2 (ja) * 1990-06-25 1996-01-10 ソシエテ ナシオナル デ プードル エ エクスプロジフ 弾薬及び弾薬の組立て方法

Similar Documents

Publication Publication Date Title
US10074363B2 (en) Method and apparatus for keyword speech recognition
US4713778A (en) Speech recognition method
US4718092A (en) Speech recognition activation and deactivation method
US4713777A (en) Speech recognition method having noise immunity
US4718088A (en) Speech recognition training method
JP2002236494A (ja) 音声区間判別装置、音声認識装置、プログラム及び記録媒体
JPS5858598A (ja) 音声認識方式
JP3578587B2 (ja) 音声認識装置および音声認識方法
JPH0643895A (ja) 音声認識装置
JP2001265387A (ja) 話者照合装置及び方法
JP2834880B2 (ja) 音声認識装置
WO1984003983A1 (en) Speech recognition methods and apparatus
JP2000148187A (ja) 話者認識方法、その方法を用いた装置及びそのプログラム記録媒体
KR20010054869A (ko) 음성인식을 위한 단어 모델링에서의 묵음 삽입 방법
JPS61260299A (ja) 音声認識装置
JPH03269500A (ja) 音声認識装置
JPS63161499A (ja) 音声認識装置
JPS63157199A (ja) 話者照合装置
JPH0431896A (ja) 音声認識装置
JPH0720889A (ja) 不特定話者の音声認識装置および方法
JPS6069695A (ja) 語頭子音のセグメンテ−ション法
JPH026078B2 (ja)
JPH06100919B2 (ja) 音声認識装置
JPS58176699A (ja) 音声標準パタ−ン登録方式
JPH02162400A (ja) 話者識別方式と装置