JPS5939760B2 - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPS5939760B2
JPS5939760B2 JP51060332A JP6033276A JPS5939760B2 JP S5939760 B2 JPS5939760 B2 JP S5939760B2 JP 51060332 A JP51060332 A JP 51060332A JP 6033276 A JP6033276 A JP 6033276A JP S5939760 B2 JPS5939760 B2 JP S5939760B2
Authority
JP
Japan
Prior art keywords
time series
parameter time
group
word
registered
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP51060332A
Other languages
English (en)
Other versions
JPS52142904A (en
Inventor
博也 藤崎
英一 白鳥
修 寺尾
泰雄 佐藤
幸夫 中井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP51060332A priority Critical patent/JPS5939760B2/ja
Publication of JPS52142904A publication Critical patent/JPS52142904A/ja
Publication of JPS5939760B2 publication Critical patent/JPS5939760B2/ja
Expired legal-status Critical Current

Links

Description

【発明の詳細な説明】 本発明は音声認識装置に係り、特に予め認識すべき単語
の第1群音素(たとえば母音)パラメータ時系列と第2
群音素(たとえば子音)のパラメータ時系列とを登録し
ておき、音声認識に際して未知入力音声の第1群音素パ
ラメータ時系列と第2群音素パラメータ時系列とを抽出
しこの未知入力音声の第1群音素パラメータ時系列と前
記登録されているそれとを照合し、かつ未知入力音声の
第2群音素パラメータ時系列と前記登録されているそれ
とを照合しこれら照合結果に基いて未知入力音声の単語
を認識する音声認識装置に係るものである。
連続音声にみられるすべての変動要因に対処しうるよう
な音声認識の実現は現段階では困難であり最近では特定
の音素の組合せすなわち限定された数の単語の認識を対
象とし、更には特定の話者の音声の認識に先立つてその
音声を予め登録することにより変動要因の大部分を回避
して実用に耐える信頼度を得るようにしている。
この種の特定話者の音声の登録を前提とした従来の限定
語単語の認識方式は登録単語と未知入力単語との照合を
1)連続的パラメータのレベルで行なう方式と、11)
離散的記号列のレベルで行なうものとに大別される。し
かし、前者1)の方式の場合記憶容量と照合時間の増大
が問題となり、後者11)の方式では認識率の低下が問
題となりーカそれを補なおうとするその処理が複雑とな
る難点を備なえている。このため、本願出願人はすでに
特願昭50−62210に於て上記欠点を除去すること
を目的として、単語中の音素を比較的高い信頼度で認識
できる第1群の音素例えば母音とそれ以外の第2群の音
素例えば子音とに分離し、第1群の音素については上記
11)の力式を採用して先ず未知入力単語の認識を行な
い、なお区別できない複数の単語が存在する場合のみ上
記第2群の音素について上記1)の力式を採用して照合
を行なうようにした音声認識力式を提案している。
ところで上記音声認識方式に於ては母音パラメノータ登
録部には予め定常5母音のパラメータすなわち単母音1
a1,11(,1uI,1eI,0のパラメータのみが
登録され、音声認識に際しては未知入力音声から分離さ
れた母音のパラメータを上記登録された単母音のパラメ
ータと比較照合し未知入力音声の母音記号列を得ている
しかしながら、単語中の母音のパラメータの値は調音形
合の影響により定常母音のパラメータの値と異なるもの
がある。このため上記音声認識方式に於ては母音識別に
誤りを生じ正しい音声認識ができない場合があつた。本
願発明は上記欠点を除去するために予め母音パラメータ
登録部に定常5母音のパラメータの代りに認識すべき単
語中に含まれる母音のパラメータを登録せしめておくこ
とにより誤認識を生じない音声認識装置を提供する。上
記目的は本発明に於ては予め認識すべき単語の第1群音
素のパラメータ時系列と第2群音素のパラメータ時系列
とを登録せしめておき、音声認識に際して未知入力音声
の第1群音素パラメータ時系列と第2群音素パラメータ
時系列を抽出しこの未知入力音声の第1群音素パラメー
タ時系列と前記登録されている第1群音素パラメータ時
系列とを照合し、かつ未知入力音声の第2群音素パラメ
ータ時系列と前記登録されている第2群音素パラメータ
時系列とを照合しこれら照合結果に基いて未知入力音声
の単語を認識することにより達成される。以下図面に従
つて本発明を詳細に説明する。
第1図は本発明の音声認識装置の一実施例構成図であり
、1は音声を例えば15チヤンネルの周波数信号に分解
する前処理手段、2は各音素のセグメンテーシヨンおよ
び照合とに用いるべきパラメータ時系列を得るためのパ
ラメータ抽出部、3はパラメータ抽出部2で抽出したパ
ラメータを第1群の音素(以下簡単のため母音と略称す
る)の区間と第2群の音素(以下簡単のため子音と略称
する)の区間とに区切るセグメンテーシヨン部、4は前
記セグメンテーシヨン部3で分離して得られた母音区間
の母音パラメータを時系列に配列した母音パラメータ時
系列として抽出する母音パラメータ時系列抽出部、5は
パラメータ時系列単語登録モードに於て予め認識すべき
各単語に対応してこれら単語の母音パラメータ時系列を
登録する母音パラメータ時系列登録部、6は単語認識モ
ード時未知入力音声の母声パラメータ時系列と上記母音
パラメータ時系列登録部5の各内容との照合を行ない距
離を演算する母音パラメータ時系列照合部、7は前記セ
グメンテーシヨン部で分離して得られた子音区間の子音
パラメータを時系列に配列した子音パラメータ時系列と
して抽出する子音パラメータ時系列抽出部、8は子音パ
ラメータ時系列を認識すべき単語ごとに登録しておく子
音パラメータ登録部、9は単語認識モード時に後述のコ
ントローラ10の指示に応じて未知入力音声中の子音パ
ラメータ時系列と上述の登録部8の内容との照合を行な
い距離を演算する子音パラメータ時系列照合部、10は
コントローラ、11はコントローラの制御のもとに母音
パラメータ時系列照合部6及び子音パラメータ時系列照
合部9の照合結果に基づき未知入力音声を認識する単語
判定部、12は出力部を夫々表わしている。またSWl
,SW2は夫々概念的に機械的スイツチの形で表わした
データカ向切替部で各モードに対応して切替えられる。
なお、図中の実線はデータ線を表わし、点線は制御信号
線を表わす。第2図は第1図に於けるパラメータ抽出部
2、セグメンテーシヨン部3、母音パラメータ時系列抽
出部4、子音パラメータ時系列抽出部7の関係を詳細に
説明するためのものである。
第2図において、101は第1ホルマント周波数に相当
する量M1および第2ホルマント周波数に相当する量鳩
を抽出するMl,M2抽出部、102はパラメータ定常
性検出量SMを抽出するSM抽出部、103はパラメー
タ定常性検出部、104はスペクトル定常性検出量Ss
を抽出するSs抽出部、105はスペクトル定常性検出
部、6は複数の各フイルタからの出力の和Pw即ちパワ
ーを抽出するPw抽出部、107は高レベル区間を検出
する高レベル区間検出部、108は音声区間を検出する
音声区間検出部、109は音声終端検出部で音声の終端
を検出するもの、110は子音パラメータXl,X2抽
出部、111は母音区間検出部、12は子音区間検出部
、14は母音パラメータ抽出部、7は子音パラメータ抽
出部を夫夫表わしている。
今Nチヤネルのフイルタからの出力が導びかれるものと
するとき、Ml,M2抽出部111は、上記出力を利用
して母音の認識に有効な少数のパラメータを得るために
、第1ホルマント周波数および第2ホルマント周波数に
相当する量Ml,M2を抽出するようにする。
この抽出には次の式が利用される。
ここでPi(Tn)は例えば10m]Se悔の時点Tn
でサンプルされたi番目のフイルタ・チヤネルの出力で
あり、Wijはその荷重、Fiはその中心周波数を表わ
している。なお荷重Wijは、ホルマント周波数既知の
合成音のフイルタ出力から、求めた量Ml,M2がホル
マント周波数に一致するように実験的に決定される。S
M抽出部2は母音区間の検出の指標となるパラメータ定
常性を検出する量SMを抽出するもので、いわば所定の
サンプリングの間にわたつて量M1およびM2を調べて
ゆく。量SMは次式で定義される。パラメータ定常性検
出部103は、上記SM抽出部102によつて抽出され
た量SMを順次検討してゆき、量SMが予め定めた閾値
以下で、かつ予め定めた時間接続するときその区間にス
ペクトル定常性があつたものとして出力を発する。
Ss抽出部104はフイルタ群からの各出力から次式即
ち、で定義された量Ssを抽出するものである。
スペクトル定常性検出部105は、上記Ss抽出部10
4によつて抽出された量Ssを順次に検討してゆき、量
Ssが予め定めた閾値以下で、かつ予め定めた時間接続
するときその区間にスペクトル定常性があつたものとし
て出力を発する。PW抽出部106は各フイルタ出力の
和を抽出するもので、i番目のフイルタ・チヤネルの出
力をPiとするとき、あるサンプリング時点Tnにおけ
るパワーPw(Tn)は次式で決定される。即ち高レベ
ル区間検出部107は、音声のパワーが高レベルである
か否かを検出するもので、上記Pw抽出部106からの
出力Pwが次式即ち、を満足するとき、その区間が高レ
ベル区間であるとみなすようにしている。
なお上記(5)式においてPmaxはある単語区間中に
おけるパワーPwの最大値を表わし、パワーPwが最大
値Pmaxのα〔%〕をこえていることを検出している
ものと考えてよい。音声区間検出部8は、音声が存在す
るか否かを検出するもので上記出力Pwが予め定めた閾
値を超えている区間を音声区間とみなすようにしている
終端検出部109は、単語の終端を検出するもので、該
終端を検出した後にそれにつづく処理が行なわれる。
第3図は各音素がもつ特性をまとめて示している。
図から明らかな如く母音及び母音連続音声はスペクトル
定常性をもち、かつ高レベル音である。そして母音区間
を決定するにはさらに上述のパラメータ定常性を用いる
ことも可能である。このことから、第2図図示の如く母
音区間検出部111は次の条件のもとで母音区間を決定
する。即ち、1)音声区間である。2)かつ高レベル区
間である。
3)かつスペクトル定常性がある。
4)かつパラメータ定常性がある。
上記に対して半母音および子音においては、1)音声区
間である。
ことを条件とし、 2)スペクトル定常性がないかまたは高レベルでないか
のいずれかである。
このことから、第2図図示の如く子音区間検出部112
に対して各検出部105,107,108,109の出
力が供給され、これにより該子音区間検出部112は子
音区間を決定する。
今第4図図示の如く単語「凧NASU」が発声され各フ
イルタ群からの出力の和Pwが第4図A図示の如き時間
経過をとつたとする。このとき、第2図図示の各検出部
103,105,107,108,109によつて第4
図Bに示す如く母音区間と子音区間とが夫々検出される
。上述の如く決定された母音区間は、第2図図示母音区
間検出部111から、母音パラメータ時系列抽出部4に
指示される。
該母音パラメータ時系列抽出部4は、Ml,M2抽出部
111からのホルマント周波数に相当する量を上記区間
によつて区分して次段に供給する。また上述の如く決定
された子音区間は、第2図図示の子音区間検出部112
から、子音パラメータ時系列抽出部7に指示される。
該子音パラメータ時系列抽出部7は、後述する如くX1
およびX2抽出部110からの出力を上記区間によつて
区分して次段に供給する。次段以降では抽出された子音
パラメータは該パラメータの形のままで登録さへ また
先に登録されたパラメータと照合されるものと考えてよ
い。X1およびX2抽出部110は夫々有声子音相互の
分離と無声子音相互の分離とを行ない得るようにするパ
ラメータX1およびX2を抽出する。
そして該パラメータX1(Tn)はで定義さぺ上記ベク
トルa1 =(All,al2,・・・,AlN)はフ
イルタ群の出力によつて得られる多次元空間内に例えば
有声子音の標本群をその上に写像した場合、各子音相互
の分離が最大となるように定められる。
即ちパラメータx1(Tn)は有声子音相互の分離を行
ない得るものとなる。またパラメータX2(Tn)はで
定義され、ベクトルA22(A2l?A229lO9a
2N)は同様に例えば無声子音の標音群に関して相互の
分離を最大にするように定められる。
即ちバラメータX2(Tn)は無声子相互の分離を行な
い得るものとなる。本発明の場合、第2図図示の子音パ
ラメータ時系列抽出部7の後段において、未知入力音声
中の子音パラメータ時系列X1およびX2と、先に登録
されている子音パラメータ時系列X1およびX2とを用
いて直接照合される。
さて本発明による音声認識装置は大別して2つのモード
即ち(4)単語登録モード[F])単語認識モードで動
作するよう構成されている。
以下各モードについて順次説明する。(4)単語登録モ
ード (1)母音パラメータ時系列登録 第1図に示す如くデータ方向切替手段SWlをA側に切
替えておく。
ついで、図示しない手段によりコンローラに通知されて
いる。「ASI」,「M品M月などの認識すべき既知の
単語を順次発音したとすると、たとえば「ASI」なる
発音に応じてセグメンテーシヨン部3は「A」と「I」
に対応する母音区間と「A」に先行する区間、子音「S
」に対応する子音区間及び「I」に後続する区間を区切
り、その結果パラメータ抽出部2により抽出した母音「
A」及び「I」に対応する母音パラメータ時系列をコン
トローラ12の制御により母音パラメータ時系列登録部
5に登録する。
こ\で、本発明においては母音パラメータとして前述の
如く第1ホルマント周波数、第2ホルマント周波数を採
用している。従つて母音パラメータ時系列登録部5には
単語「ASI」に対応して母音「A」,「月の各第1、
第2ホルマント周波数の時系列が記憶されたことになる
尚、母音パラメータ時系列登録部5には各単語に対応し
て母音区間「A」の第1ホルマント周波数の平均値、第
2ホルマント周波数の平均値及び母音区間「」の第1ホ
ルマント周波数の平均値、第2ホルマント周波数の平均
値を時系列に登録してもよく、又母音区間の中心に於け
る第1、第2ホルマント周波数を登録してもよい。
以後の説明では1母音に対し1対の第1、第2ホルマン
ト周波数が登録されているものとして説明をする。かく
して、以後同様に認識すべき単語に応じた各第1、第2
ホルマント周波数の時系列が母音パラメータ時系列登録
部5に登録されてゆき最終的に全認識すべき単語のホル
マント周波数が母音パラメータ時系列登録部5に登録さ
れたことになる。
(2)子音パラメータ時系列登録 子音パラメータ時系列は第1図のスイツチSW2をA側
に切替えておくことにより前記母音パラメータ時系列の
登録と同時に子音パラメータ時系列登録部8に登録する
ことができる。
たとえば「AZE」が入力されるとセグメンテーシヨン
部3によつて区切られた「A」に先行する区間、子音「
Z」に対応する区間、「E」に後続する区間のそれぞれ
に対応するパラメータ抽出部2により抽出した子音パラ
メータX1(Tn),X2(Tn)を子音パラメータ時
系列登録部8に登録する。
以後同様な動作に従つて認識すべき全単語とそれぞれの
単語中の複数の子音区間の子音パラメータ時系列との対
応関係が子音パラメータ時系列登録部8に登録されるこ
とになる。(B)単語認識モード 第1図のデータ方向切替手段SWl,SW2をB接点側
に切替えておく。
この状態に於て未知入力音声が発声されたとする。母音
パラメータ時系列抽出部4は母音パラメータ時系列を抽
出しこれを母音パラメータ時系列照合部6に送出する。
一力、母音パラメータ時系列登録部5からは未知入力音
声と同音節数を有する登録単語の内容が順次適当なタイ
ミングで照合部6に導かれ各単語毎に照合部6に於てた
とえば次式で示されるLk(以後距離という)の計算が
実行される。
上式中nは未知入力音声の音節数、mは登録単語数MO
Ji,Mkjiはそれぞれ未知入力音声及び登録単語の
パラメータ時系列に於けるi番目の値すなわちi音節の
母音パラメータである。
さて、上述の如く得られた未知入力音声と同音節数の各
登録単語との距離は予め定めた閾値と比較照合さ礼該閾
値以下の登録単語が単語判定部11に通知される。
この単語判定部11に通知された登録単語の数が2以上
ある場合には、当該単語はコントローラ10の制御のも
とに子音パラメ一タ時系列登録部8に通知され、これら
通知された登録単語の子音パラメータ時系列は子音パラ
メータ時系列抽出部7を介して子音パラメータ時系列照
合部9に与えられている未知入力音声の子音パラメータ
時系列と比較され、照合部9において後述の如く登録単
語と未知入力音声との距離が演算される。尚、上記母音
パラメータ照合部6から単語判定部に通知される単語と
しては閾値以下の単語としたが、閾値を考慮せず距離の
小さい順に複数個たとえば3個候補登録単語として単語
判定部に通知してもよい。
さて、子音パラメータ時系列照合部に於ける登録単語と
未知入力音声との照合はそれぞれの単語の対応する子音
区間同志の照合にもとづいて行なわへ各子音区間の子音
パラメータ時系列の照合によつて得られる距離の和が登
録単語と未知入力音声との距離として定義される。
登録単語と未知入力音声との対応する子音区間の子音パ
ラメータ時系列の照合は以下の如く行なわれる。
、第5図はそのための照合の態様を説明する説明図を示
している。
今、先に登録されている子音パラメータ時系列X1およ
びX2とが、第5図A図示の如きタイミングにおいて図
示の如きレベルをそなえていたとし、未知入力音声から
抽出されたパラメータ時系列X1およびX2とが、第5
図B図示の如きタイミングにおいて図示の如きレベルを
そなえていたとする(Xl,X2は不連続であるが説明
上連続的に表わしている)。なお図中Te,ts′は当
該音素に対応する子音区間の始点を示し、Te,te′
は同区間の終点を示し、Tc,tc′はその区間の照合
中心点を示している。第5図C図示の如く、例えば子音
区間内において、パワーの急変成いは最小時点として指
定する両者のパラメータの照合中心点TC(5tc′と
が一致するようにタイミングあわせを行ない、その上で
両者の照合をとるようにする。この照合方式を採用する
ことにより、照合中心点Tc(又はTc′)から前後所
定範囲内において照合を行なうだけで、両者の一致、不
一致を簡単に決定することが可能になる。上記タイミン
グあわせを行なうための構成は、点Ts,ts′,Tc
,tc′,Ts,ts′が夫々決定されれば第5図A図
示のパラメータ時系列および/または第5図B図示のパ
ラメータ時系列を時間遅れ手段に導びくことによつて容
易に達成できる。いま、上記中心点Tc′を第5図Cに
示す如くTcに合せた際、照合の範囲がTe′+Tc−
Tc′〜Te間となつた場合、子音区間の子音パラメー
タ時系列の照合によつて得られる距離は次式のSk,i
として求められる。ここでSk,iは未知入力音声とk
番目の登録単語の照合においてそれぞれの単語のi番目
の子音区間相互の距離を表わす。
なお、XOl(t),X卜(t)はそれぞれ未知入力音
声、登録単語中の対j応する子音区間の子音パラメータ
の値を示す。
上記Sk,iから次式の如く子音パラメータ時系列を用
いた未知入力音声と登録単語との距離Skを演算しその
結果を単語判定部11に通知すれば単語判定部は距離S
kの最小の登録単語を未知入力音声の単語として認識し
、コントローラ10の制御のもとに出力部にこれを出力
する。尚、単語判定部11に於ては上記(9),01)
式で与えられる距離Lk,Skの荷重和として次式のD
kを演算し、Dkの最小の登録単語を決定し、これを未
知入力音声の単語と認識せしめる如くしてもよい。こ\
で、WL,WSは荷重であり実験的に最適な値として決
められるものである。
以上、本発明によれば予め認識すべき単語の第1群音素
パラメータ時系列と第2群音素パラメータ時系列を登録
しておき、音声認識に際して、未知入力音声の第1群音
素パラメータ時系列と第2群音素パラメータ時系列とを
抽出し、この未知入力音声の第1群音素パラメータ時系
列と前記登録されているそれとを照合し、かつ未知入力
音声の第2群音素パラメータ時系列と前記登録されてい
るそれとを照合し、これら照合結果に基づき未知入力音
声の単語を認識するから高い信頼度の音声認識ができる
又、従来の力式の如く調音結合による誤認識を除去でき
る結果増々音声認識の信頼度を高めることができる。
【図面の簡単な説明】
第1図は本発明の一実施構成図、第2図は第1図の1部
詳細図、第3図は各音素の特性説明図、第4図は本発明
により区別される母音区間と子音区間とを説明する説明
図、第5図は本発明によるパラメータレベルでの照合態
様を説明する説明図である。 図中、2はパラメータ抽出部、3はセグメンデーシヨン
部、4は母音パラメータ時系列抽出部、5は母音パラメ
ータ時系列登録部、6は母音パラメータ時系列照合部、
7は子音パラメータ時系列抽出部、8は子音パラメータ
時系列登録部、9は子音パラメータ時系列照合部、10
はコントローラ、11は単語判定部である。

Claims (1)

  1. 【特許請求の範囲】 1 音声信号の周波数分析結果を利用して各音素に対す
    るパラメータを抽出することにより音声認識を行なう音
    声認識装置に於て、単語を予め定めた第1群の音素区間
    とそれ以外の第2群の音素区間とに分離するセグメンテ
    ーシヨン部、第1群の音素パラメータを時系列に配列し
    てなるパラメータ時系列を抽出する第1群音素パラメー
    タ時系列抽出部、該抽出された第1群音素パラメータ時
    系列を認識すべき単語毎に予め登録する第1群音素パラ
    メータ時系列登録部、第2群の音素を時系列に配列して
    なる第2群音素パラメータ時系列を前記各単語に対応し
    て予め登録する第2群音素パラメータ時系列登録部、未
    知入力音声に対応した第1群音素パラメータ時系列と前
    記第1群音素パラメータ時系列登録部の内容とを照合す
    る第1群音素パラメータ時系列照合部、未知入力音声に
    対応した第2群音素パラメータ時系列と前記第2群音素
    パラメータ時系列登録部の内容とを照合する第2群音素
    パラメータ時系列照合部を備え、未知入力音声に対応し
    て上記第1群音素パラメータ時系列照合部及び第2群音
    素パラメータ時系列照合部の照合結果により該未知入力
    音声の認識を行なうことを特徴とする音声認識装置。 2 音声信号の周波数分析結果を利用して各音素に対す
    るピラメータを抽出することにより音声認識を行なう音
    声認識装置において、未知入力音声の第1群音素パラメ
    ータ時系列と前記登録されている第1群音素パラメータ
    時系列との距離を演算し、ついで該距離が予め定めた閾
    値以下の各登録単語に対応する前記登録されている第2
    群音素パラメータ時系列と前記未知入力音声の第2群音
    素パラメータ時系列との距離を演算し、この距離が最小
    の登録単語を未知入力音声の単語として認識することを
    特徴とする特許請求の範囲第1項記載の音声認識装置。 3 音声信号の周波数分析結果を利用して各音素に対す
    るパラメータを抽出することにより音声認識を行なう音
    声認識装置において、未知入力音声の第1群音素パラメ
    ータ時系列と前記登録されている第1群音素パラメータ
    時系列との第1の距離を演算し、ついで該第1の距離が
    予め定めた閾値以下の各登録単語に対応する前記登録さ
    れている第2群音素パラメータ時系列と前記未知入力音
    声の第2群音素パラメータ時系列との第2の距離を演算
    し、前記第1、第2の距離の荷重和が最小の登録単語を
    未知入力音声の単語として認識することを特徴とする特
    許請求の範囲第1項記載の音声認識装置。
JP51060332A 1976-05-24 1976-05-24 音声認識装置 Expired JPS5939760B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP51060332A JPS5939760B2 (ja) 1976-05-24 1976-05-24 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP51060332A JPS5939760B2 (ja) 1976-05-24 1976-05-24 音声認識装置

Publications (2)

Publication Number Publication Date
JPS52142904A JPS52142904A (en) 1977-11-29
JPS5939760B2 true JPS5939760B2 (ja) 1984-09-26

Family

ID=13139095

Family Applications (1)

Application Number Title Priority Date Filing Date
JP51060332A Expired JPS5939760B2 (ja) 1976-05-24 1976-05-24 音声認識装置

Country Status (1)

Country Link
JP (1) JPS5939760B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61129414A (ja) * 1984-11-27 1986-06-17 Agency Of Ind Science & Technol 適応型消音装置

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS54145407A (en) * 1978-05-06 1979-11-13 Hiroya Fujisaki Speech recognition system
JPS54145408A (en) * 1978-05-06 1979-11-13 Hiroya Fujisaki Speech recognition system
JPS54145409A (en) * 1978-05-06 1979-11-13 Hiroya Fujisaki Monosyllable speech recognition system
JPS56126897A (en) * 1980-03-10 1981-10-05 Sanyo Electric Co Voice recognision device
JPS5766496A (en) * 1980-10-14 1982-04-22 Fujitsu Ltd Voice recognizing system
JPS58130396A (ja) * 1982-01-29 1983-08-03 株式会社東芝 音声認識装置
JPS58199397A (ja) * 1982-05-17 1983-11-19 伊福部 達 音声認識装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61129414A (ja) * 1984-11-27 1986-06-17 Agency Of Ind Science & Technol 適応型消音装置

Also Published As

Publication number Publication date
JPS52142904A (en) 1977-11-29

Similar Documents

Publication Publication Date Title
Liu Landmark detection for distinctive feature‐based speech recognition
US6553342B1 (en) Tone based speech recognition
US20180012602A1 (en) System and methods for pronunciation analysis-based speaker verification
JPS5939760B2 (ja) 音声認識装置
US11961510B2 (en) Information processing apparatus, keyword detecting apparatus, and information processing method
Metze et al. Fusion of acoustic and linguistic features for emotion detection
Davis et al. Evaluation of acoustic parameters for monosyllabic word identification
Majidnezhad A HTK-based method for detecting vocal fold pathology
JPS58108590A (ja) 音声認識装置
Paliwal et al. Synthesis‐based recognition of continuous speech
Chun A hierarchical feature representation for phonetic classification dc by Raymond YT Chun.
JPS5936759B2 (ja) 音声認識方法
JPH1097269A (ja) 音声検出装置及び方法
Sekhar et al. Recognition of stop-consonant-vowel (SCV) segments in continuous speech using neural network models
He The benefits of acoustic perceptual information for speech processing systems
Nguyen et al. Tau Net a neural network for modeling temporal variability
JPH0455518B2 (ja)
KR20040100592A (ko) 이동 기기에서의 실시간 화자독립가변어 음성인식 방법
Kalinli et al. Continuous speech recognition using attention shift decoding with soft decision.
JPH0682275B2 (ja) 音声認識装置
JPS6336678B2 (ja)
JPS63161499A (ja) 音声認識装置
Zergat et al. SVM against GMM/SVM for dialect influence on automatic speaker recognition task
JPS6180298A (ja) 音声認識装置
JPS60182499A (ja) 音声認識装置