JPS63223798A - 音声認識方法 - Google Patents

音声認識方法

Info

Publication number
JPS63223798A
JPS63223798A JP62059413A JP5941387A JPS63223798A JP S63223798 A JPS63223798 A JP S63223798A JP 62059413 A JP62059413 A JP 62059413A JP 5941387 A JP5941387 A JP 5941387A JP S63223798 A JPS63223798 A JP S63223798A
Authority
JP
Japan
Prior art keywords
similarity
voice
section
speech
reference point
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP62059413A
Other languages
English (en)
Other versions
JP2506730B2 (ja
Inventor
泰助 渡辺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP62059413A priority Critical patent/JP2506730B2/ja
Publication of JPS63223798A publication Critical patent/JPS63223798A/ja
Priority to US07/385,525 priority patent/US4984275A/en
Priority to US07/777,713 priority patent/US5220609A/en
Application granted granted Critical
Publication of JP2506730B2 publication Critical patent/JP2506730B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】
産業上の利用分野 本発明は人間の声を機械に認識させる音声認識方法に関
するものである。 従来の技術 近年音声認識技術の開発が活発に行なわれ、商品化され
ているが、これらのほとんどは声を登録した人のみを認
識対象とする特定話者用である。 特定話者用の装置は認識すべき言葉をあらかじめ装置に
登録する手間を要するだめ、連続的に長時間使用する場
合を除けば、使用者にとって大きな負担となる。これに
対し、声の登録を必要とせず、使い勝手のよい不特定話
者用の認識技術の研究が最近では精力的に行なわれるよ
うになった。 音声認識方法を一般的に言うと、入力音声と辞書中に格
納しである標準的な音声(これらはパラメータ化しであ
る)のパターンマツチングを行なって、類似度が最も高
い辞書中の音声を認識結果として出力するということで
ある。この場合、入力音声と辞書中の音声が物理的に全
く同じものならば問題はないわけであるが、一般には同
一音声であっても、人が違ったシ、言い方が違っている
ため、全く同じにはならない。 人の違い、言い方の違いなどは、物理的にはスペクトル
の特徴の違いと時間的な特徴の違いとして表現される。 すなわち、調音器官(口、舌、のどなど)の形状は人ご
とに異なっているので、人が違えば同じ言葉でもスペク
トル形状は異なる。 また早口で発声するか、ゆっ〈9発声するかによって時
間的な特徴は異なる。 不特定話者用の認識技術では、このようなスペクトルお
よびその時間的変動を正規化して、標準パターンと比較
する必要がある。 不特定話者の音声認識に有効な方法として、本出願人等
は既にパラメータの時系列情報と統計的距離尺度を併用
する方法を提案している(二矢田他:゛′簡単な不特定
話者用音声認識方法″、日本音響学会講演論文集、1−
1−4(昭和61年3月))ので、その方法を以下に説
明する。 この方法は、パターンマツチング法を用いて、音声を騒
音中からスポツティングすることによって、音声の認識
を行なうと同時に音声区間をも検出することができる。 まず、パターンマツチングに用いている距離尺度(統計
的距離尺度)について説明する。 入力単語音声長をJフレームに線形伸縮し、■フレーム
あたシのパラメータベクトルをxjとすると、入力ベク
トルXは次のようになる。 X ” (XI 、X2 +””” + ’J)(ここ
で、各x3はp次元のベクトルである。 単語ωk(k=1 、2 、・・・、K)の標準パター
ンとして、平均値ベクトルをμk、共分散行列をWkと
すると、事後確率P(ωkIX)を最大とする単語を認
識結果とすればよい。 ベイズの定理より P(ωklK)=PCωk)・P(X+ωk)/P(X
)  (1)右辺第1項のP(ωk)は定数と見なせる
。正規分布を仮定すると、第2項は P (X Iωk)=(2π)  IWkI  、分母
項P (X)は入力パラメータが同一ならば定数と見做
せるが、異なる入力に対して相互比較するときは、定数
にならない。ここでは、P(X)が平均値1lIX s
共分散行列Wxの正規分布に従うものと仮定する。 ・exp(−1/2(X−#x)・Wx ・(X−ax
) )    (3)(1)の対数をとり、定数項を省
略して、これをIt、にと置くと、 L k= (X−Iuk ) ・w−’ ・(X−#k
)−(X−#x)4%’x’ −(lax)+ log
 IWk I −log lWx l        
(4)ここで、Wk、Wxを全て共通と置きWとする。 すなわち、 W=(W’s+wz+・−・”Wk+wX)/(K+1
)   (5)として(4)式を展開すると、 Lk=Bk−Ak−X              (
6)ただし、 Ak=2 (%W’ *#に一1%’  拳#x)  
              (7)Bk=#klIW
11#に一#x11w参#X(8)(6)式は計算量が
少ない1次判別式である。ここで、(6)式を次のよう
に変形する。 Ak=(a”、a”、  ・・・ 、a(IQ)とする
と、すなわち、Lkはフレームごとの部分類似度d0=
1!・xjOJ回の加算と1回の減算で求められる。 次に、上記の距離尺度を用いて、騒音中から音声をスポ
ツティングして認識する方法と、計算量の削減法につい
て説明する。 音声を確実に含む十分長い区間を対象として、この中に
種々の部分区間を設定して、各単語との類似度を(9)
式によって求め、全ての部分区間を通して類似度が最大
となる単語を認識結果とすればよい。この類似度計算を
そのまま実行すると計算量が膨大となるが、単語の持続
時間を考慮して部分区間長を制限し、また計算の途中で
部分類似度d吟を共通に利用することによって、大幅に
計算量を削減できる。第4図は本方法の説明図である。 入力と単語にの照合を行う場合、部分区間長nト) (n8 <n<n’T)を標準パターン長Jに線形伸伸
縮し、フレームごとに終端固定で類似度を計算していく
様子を示している。類似度はQR上の点Tから出発して
Pで終るルートに沿って(9)式で計算される。したが
って、1フレームあたりの類似度計算はΔPQR内で行
われる。ところで(9)式のxjは、区間長nを伸縮し
た後の第jフレーム成分なので、対応する入力フレーム
i′が存在する。 そこで入力ベクトルを用いて、dQを次のように表現で
きる。 (へ)・ d  (i’、j):l’9 * xi       
  (1(Iただし、r’ =+ −rrl (3) 
 1       (lυここで、rn(j)は単語長
。とJの線形伸縮を関係づける関数である。したがって
、入力の各フレームと−との部分類似度が予め求められ
てぃれば、(9)式はi′の関係を有する部分類似度を
選択して加算することによって簡単に計算できる。とこ
ろで、ΔPQRは1フレームごとに右へ移動するので、
PS上で−とJCIの部分類似度を計算して、それを、
△PQSに相当する分だけメモリに蓄積し、フレームご
とにシフトするように構成しておけば、必要な類似度は
全てメモリ内にあるので、部分類似度を求める演算が大
幅に省略でき、計算量が非常に少なくなる。 第5図は従来例の実現方法を説明した、機能ブロック図
である。未知入力音声信号はAD変換部10で、8KH
zサンプリングされて12ビツトのディジタル信号に変
換される。音響分析部11は10m5ec (1フレー
ム)ごとに入力信号のLpc分析を行ない、10次の線
形予測係数と残差パワーを求める。特徴パラメータ抽出
部12は、線形予測係数と残差パワーを用いて、LPC
ケプストラム係数C1−C5とパワー環Co を特徴パ
ラメータとして求める。したがって、7レームごとの特
徴ベクトルXは x” =(Co + C1t ・・・・” +cS’ 
       αりである。なお、LPG分析とLPC
ケグストラム件数の抽出法に関しては、例えばJ、D、
マーケル。 A、J(、グレイ著、鈴木久喜訳「音声の線形予測」に
詳しく記述されているので省略する。 フレーム同期信号発生部13は10m5ecごとのタイ
ミング信号(フレーム信号)を発生する部分であり、認
識処理はフレーム信号に同期して行なわれる。 標準パターン選択部18は、1フレームの期間に、標準
パターン格納部17に格納されている単語ナンバーk 
= 1.2.・・・Kを次々と選択してゆく。 部分類似度計算部21では、選択された標準バタ分類似
度d”(i、j)を計算する。 ω d  (itj)=l”xi           Q
3(j=1,2.・・・ J) 計算した部分類似度は類似度バッファ22へ送出して蓄
積する。類似度バッファ22は、新しい入力が入ると、
一番古い情報が消滅する構成になりている。 区間候補設定部15は選択された単語ナンバーごとに、
その単語の最小長−と最大長−を設S        
  e 定する。時間伸縮テーブル24にはα0式の関係がテー
ブル形式で洛納されており、単語長nとフレームJを指
定才ると千れに対応するi′が求まる。 j=1.2.・・・Jを類似度バッファ22から読み出
ず。M 似度加$m 23 id 、 X  d ” 
(1’、J) ’k ’+tt 算L、]=1 (9)式によ、〕てLkを求める。類似度比較部20は
、求めたLkと一時記憶19の内容を比較し、類似度が
大きい(距離が小さい)方を一時記憶】9に記録する。 このようにL7て、ン”レーム1=ioから始め、標準
パターンに=1に対してn  <nuneの範囲で最大
類似度IE°+ (Inax)を求め、次にk = 2
としてn(2)≦nun(2)の範囲で求めたしiIと
L’:(max)S         e と比較15、て類似度の最大値を求め、このようにして
に−Kまで同様な手順を繰返し、て最大類似度り宝“(
max)とその時の単語ナンバーに′を一時記憶19に
記憶する。次にi=:io+△iとして同様な手順を繰
返して、最終:7レームi=Iに到達し5た時に一時記
憶に残されている単語ナン・・<−に:=+krriが
認識結果である。また、最大類似度が得られた時のフレ
ームナンバーi=imと単語長n =” I’l IT
I  を一時記憶19に蓄積し、更新−むるようにして
おけば、認識結果上同時に、その時の音声区間を結果と
して求めることができる。音声区間il□、j: l(
HrJ11ヘーImである。 発明が解決しようとする問題点 かかる方法における問題点は、音声を確実に含む十分長
い区間を対象としで、この中の取り得るすべての音声区
間とパターン・マツチングを実行させるため、例えば、
数字音声の認識において、「ゼロ」と発声しても、[−
ゼロ」のE口」の部分で「ゴ」と認識するような長い発
声単語の部分に、短い単語に認識される可能性が大きい
。 本発明の目的は上記問題点を解決するもので、音声を確
実に含む十分長い区間の中から取り得る音声区間をでき
るだけ、パワー情報を用いて、制限することによって高
い認識率を有する音声認識方法を提供するものである。 問題点を解決するだめの手段 本発明は、上記目的を達成するもので、フレーム毎のパ
ワー値が、ノイズ学習したあるいき値θN以上で、Nフ
レーム連続する場合、N=NI(一定)より以後のフレ
ームで、パワー値が、08以上であるフレームが続く限
り、該当フレームを始端とする音声区間は、認識対象か
ら除外するものである。 作用 本発明は不特定話者用の音声区間を明確に定めナイワー
ド・スボッテング手法を用いた認識方法において、パワ
ー情報によって、一部音声区間を制限することによシ、
長い発声単語が、短かい発声単語に、誤まる確率を低く
し、全体の認識率を向上させることができる。 実施例 以下に本発明の実施例を図面を用いて詳細に説明する。 第1図は本発明の一実施例における音声認識方法の具現
化を示す機能ブロック図である。 まず本実施例の基本的な認識の考え方は、従来例に上げ
た方式とほぼ同じである。すなわち、未知人力音声信号
はAD変換部110で、8KHzサンプリングされて、
12ビツトのディジタル信号に変換される。音響分析部
111ば、l Qmsec(1)L/−ム)ごとに入力
信号のL P G分析を行ない、10次の線形予測係数
と残差パワーを求める。特徴パラメータ抽出部112は
、線形予測係数と残差パワーを用いて、LPCケプスト
ラム係数C,−C,とパワー環Co を特徴パラメータ
として求める。したがって、フl/−ム毎の特徴ベクト
ルXは、 X
【” (CO,C+ 、 ・’−・、C9)    
      C4である。なお、LPG分析とLPCケ
プストラム係数の抽出法に関しては、例えばJ、D、マ
ーケル。 A、H,グレイ著、鈴木久喜訳「音声の線形予測」に詳
しく記述されているので省略する。 フレーム同期信号発生部113は、10rnsecごと
のタイミング信号(フレーム信号)を発生する部分であ
シ、gR処理はフレーム信号に同期して行なわれる。 標準パターン選択部116は、1フレームの期間に、標
準パターン格納部115に格納されている単語ナンバー
に=1.2.・・・・・・、Kを次々と選択してゆく。 部分類似度計算部114では、選択された標準パターン
1(lりと第iフレームの特徴ペクトルx、の部分類似
度d″(i、j)を計算する。 k) d (i、j)=a’9”訃(j=1.2.=1)  
(149計算した部分類似度は類似度バッファ119へ
送出して蓄積する。類似度バッファ119は、新しい入
力が入ると、一番古い情報が消滅する構成になっている
。 区間候補設定部117は、選択された単語ナンω バーごとに、その単語の最小長n と最大炎nk)S 
           e を設定する。時間伸縮テーブル118にはaD式の関係
がテーブル形式で格納されておシ、単語長n(n ≦n
≦nk))とフレームjを指定すると、そk) S          e れに対応するi′が求まる。n ≦n≦n″の範囲面 S          e の各々の単語長nに対してi′を読み出し、それに相当
スル部分類似度dGc)(i′、j)、j=1.2.・
・・Jを類似度バッファ119から読み出す。類似度加
ってLkを求める。類似度比較部121は、求めたLk
と今までのフレームで最大の類似度を格納している一時
記憶122の内容と比較し、類似度が大きい(距離が小
さい)方を一時記憶122に記録する。 このようにして、フレーム1=1(1から始め1、標準
パターンに=1に対して、no≦n≦n(+1の範囲で
最大類似度max (L’s’ )を求め、次にに=2
としてn ≦n≦n の範囲で求めたmax(L’z。 )(崎      (2) S          e とmax(L’t°)を比較して類似度の最大値を求め
、このようにしてに=Kまで同様な手順を繰返して最大
類似度maxCL品、”)とその時の単語ナンバーk”
を一時記憶122に記憶する。次にi:i、+Δiとし
て同様な手順を繰返して、最終フレームi=1に到達し
た時に一時記憶122に残されている単語ナンバーに=
kmが認識結果である。 次に、上記説明における1、からlまでの走査区間決定
方法と音声区間制御法につい゛て説明する。 第2図は、走査開始(類似度比較部以後の開始〕1、7
レームと認識完了(走査終了)■フレームと音声との関
係を表わしたものである。 本実施例においては、走査区間の始端はパワー情報で求
め、終端はパワー情報と類似度情報を併用して求め、音
声区間制御法は、パワー情報を利用用する。パワー情報
による方法は、人の声の方が周囲の騒音よシも大きいこ
とを利用する方法であるが、人の声の大きさは環境に影
響されるので、声の大きさのレベルをそのまま利用して
も良い結果は得られない。しかし、人の発声は、静かな
環境では小さく、やかましい環境では大きくなる傾向が
あるので、信号対ノイズ比(S/N比)を用いれば、環
境騒音の影響をあまシ受けずに音声を検出できる。 パワー計算部123は、フレーム毎ニパワー(対数値)
を計算する。以下ノイズ・レベル学習部124、パワー
比較部125について説明する。 第3図において、実線はパワー(対数値)の時間変化を
示す。この例ではa、b、cの3つのパワーピークが生
じているが、このうちaはノイズによる不要なピークで
あるとする。破線はノイズの平均レベル(PN)、また
一点鎖線はノイズの平均レベルよシ常に#N(dB)だ
け大きい、閾値レベル(P、)である。ノイズの平均レ
ベルPNは次のようにして求める。パワー値をPとする
とただし、Pmは閾値レベル以下のパワーレベルを有す
る第mフレームパワー値である。すなわちPNはM値し
ベル以下(ノイズレベル)ノフレームの平均値である。 このようにすると、第3図の破線で示すように、ノズル
の平均レベルPNはパワー値を平滑化した波形となる。 また閾値レベルP、、Pには P、=PN + θ、           αηであ
る。 第3図を例として音声検出および音声区間制御の方法を
説明する。信号の始まシ部におけるパワーを初期ノイズ
レベルとし、式aeによってノイズノ平均レベルPNを
求めながら、パワーレベルPと閾値レベルP、を比較し
てゆく。最初のパワービークaはP、以下であるので、
音声として検出されない。パワービークりの立上郵の部
分dでパワーレベルが26以上になると式α0の操作を
中止L、5、以後P=P、になるまでPNおよびP。を
一定に保つ。そしてCからfにかけてP≦P、となるの
で式住Qの操作を行なう。fからg′!、ではP〉P、
であるからPN 、P、は一定となる。結果としてFD
P、となる区間B、Dを音声が存在する区間とする。 音声区間制御法は、パワー比較部】25でPとP、との
比較を行ない、フレーム毎の比較結果を除外音声区間決
定部126へ送る。第3図において、d点までは、P<
P、の結果が送られる。d点を越えると、FDP、の状
態が続く。ここで、除外音声区間決定部126では、連
続するP>P。 ノ状態のフレーム数をカウントする機能を有し、このカ
ウンタは、PDP、の結果でリセットされる。除外音声
区間決定部126では、カウント数NがN1(一定値)
より大きい時、1を部分類似度計算部114へ送る。よ
って第3図で説明すると、P>Poとなる区間B、Dを
音声が存在する区間とし、BとDの内、d点およびf点
よりNフレーム後のF、Gの区間において、除外音声区
間決定部126が1を出力し、この区間は、音声の内部
であるため、音声区間の始端であり得ないことを示して
いる。 部分類似度計算部1】4では、通常は、部分類似度d”
(i、j)をfIs式で計算するが(+はフレーム番号
、kは標準パターン・ナンバー、jは線形伸縮・ノーン
バー)、除外音声区間決定部126の出力が1の場合、
d(k)(i、j)は次式とする。 d′c)(i 、 1 )=CONS (一定値) (
J=1 )a樽 ω d  (i、j)=a”9’・K  (j=2.3.−
J)但し、一定値は負の小さな値とする。 このことにより、1番目のフレームを音声区間のの始端
(j=1)するすべての類似度は、一定値(CONS)
を含むだめ、他に比べて小さくなるため、最大類似度に
該当しないため、認識の対象からはずされることとなる
。 このことにより、例えば、数字音声の「ゼロ」と「ゴ」
の認識の場合、[ゼロ−1の[口」の部分で「ゴ」が高
い類似度を示し、「ゼロ」を「ゴ」と誤認識する場合が
多い。本手法を用いれば、「ゼロ」の発声においては、
殆んど「ゼ」の頭から「口」の終りまで、P>P、の状
態が続き、1口」を始端とする音声区間は存在しなくな
り(類似度が小さくなるため)、誤認識がさけられる。 走査区間設定部127では、第2図のIO走査開始を、
P>P、の時点で行ない(第3図のd点)、■は一度P
>P、になってからP≦POがHフレーム継続し、それ
までの最大類似度が、あるいき値以−ヒになっていれば
、終了■に達する。 従来例に述べた音声区間を決定せず、音声らしき所の周
辺において考えられる音声区間すべての中から、最大類
似度を求める方法においては、一般的にパワー情報を用
いて、音声区間を決定し、標準パターンとマツチングす
る方法よりも、騒音レベルが高い場合や非定常なノイズ
が混入する場合は、強いと言えるが、逆に、認識対象単
語中に、長い単語の一部分と非常に似かよった短い単語
があった場合、非常に認識率が悪くなる。たとえば、認
識対象単語中に「新大阪」と「大阪」がある場合等でち
る。本実施例の場合、音声を確実に含む十分長い区間の
中からJl得る音声区間をできるだけパワー情報を用い
て制限することによりこの弱さを補う手法は、非常に有
効な手段である。 発明の効果 以上要するに本発明は、音声を確実に含む十分長い区間
の中から、パワー情報を用いて始端となり得ないことが
明らかな音声区間を、認識対象から除外することにより
、長い発声単語が短かい発声単語に誤まる確率を低くで
き、全体の認識率を向上させることができる利点を有す
る。
【図面の簡単な説明】
第1図は本発明の一実施例における音声認識方法を具現
化する機能ブロック図、第2図は本実施例における標準
バター7とのマツチングを行う開始、終了時期と音声と
の関係図、第3図は本実施例におけるパワー情報を用い
たノイズ・パターンうめ込みタイミングと走査区間決定
のだめの音声有無決定法を説明するパワーレベル図、第
4図は標準パターンとのパターンマツチング法を説明し
た概念図、第5図は従来例の方法を説明した機能ブロッ
ク図である。 110・・・AD変換部、111・・・音響分析部、1
12・・・特徴パラメータ抽出部、113・・・フレー
ム同期信号発生部、114・・・部分類似度計算部、1
15・・・標準パターン格納部、116・・・標準パタ
ーン選択部、117・・・区間候補設定部、118・・
・時間伸縮テーブル、119・・・類似度バッファ、1
20・・・類似度加算部、121・・・類似度比較部、
122・・・一時記憶、123・・・パワー計算部、1
24・・・ノイズ・レベル学習部、125・・・パワー
比較部、126・・・除外音声区間決定部、127・・
・走査区間設定部。 代理人の氏名 弁理士 中 尾 敏 男 ほか1名頁)
− 一                 やへ第2図 第4図

Claims (4)

    【特許請求の範囲】
  1. (1)音声とその前後の騒音を含む未知入力信号からパ
    ワー情報を用いて音声の存在を検出し、検出した時点を
    基準点として、基準点と基準点からN(N_1≦N≦N
    _2)だけ離れた区間の未知入力信号を区間長Lに線形
    伸縮し、伸縮した区間の特徴パラメータを抽出し、この
    特徴パラメータと認識対象とする複数の音声の標準パタ
    ーンとの類似度又は距離をそれぞれ求めて比較し、N_
    1からN_2までの範囲において、基準点以前のパワー
    情報を用いて基準点毎にNの範囲を決定し、その範囲内
    でNを変化させながら前記操作を行ない、さらに基準点
    を単位区間ずつずらせながら同様の操作を行なって類似
    度又は距離を次々と求めて比較してゆき、パワー情報の
    動きを用いて求めた音声の持続時間と類似度の時間的な
    変化を併用して決定した処理終了時点へ基準点が到達し
    た時における、全ての基準点そして全ての時間伸縮に対
    して最大類似度又は最小距離を得る標準パターンに対応
    する音声を認識結果として出力することを特徴とする音
    声認識方法。
  2. (2)音声信号とノイズの比率を用いて音声の有/無を
    検出することを特徴とする特許請求の範囲第1項記載の
    音声認識方法。
  3. (3)未知入力信号の特徴パラメータと各音声の標準パ
    ターンとの類似度又は距離を統計的距離尺度を用いて計
    算することを特徴とする特許請求の範囲第1項記載の音
    声認識方法。
  4. (4)統計的距離尺度が、事後確率に基づく尺度、一次
    判別関数、二次判別関数、コハラノビス距離、ベイズ判
    定、複合類似度に基づく尺度のうちいずれかであること
    を特徴とする特許請求の範囲第3項記載の音声認識方法
JP62059413A 1987-03-13 1987-03-13 音声認識方法 Expired - Lifetime JP2506730B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP62059413A JP2506730B2 (ja) 1987-03-13 1987-03-13 音声認識方法
US07/385,525 US4984275A (en) 1987-03-13 1989-07-27 Method and apparatus for speech recognition
US07/777,713 US5220609A (en) 1987-03-13 1991-10-21 Method of speech recognition

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62059413A JP2506730B2 (ja) 1987-03-13 1987-03-13 音声認識方法

Publications (2)

Publication Number Publication Date
JPS63223798A true JPS63223798A (ja) 1988-09-19
JP2506730B2 JP2506730B2 (ja) 1996-06-12

Family

ID=13112562

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62059413A Expired - Lifetime JP2506730B2 (ja) 1987-03-13 1987-03-13 音声認識方法

Country Status (1)

Country Link
JP (1) JP2506730B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5336425A (en) * 1990-06-19 1994-08-09 Henkel Corporation Acidic aluminum cleaner containing an oxidant and a nonionic surfactant stabilized by a glycol
JP2008107706A (ja) * 2006-10-27 2008-05-08 Yamaha Corp 話速変換装置およびプログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5336425A (en) * 1990-06-19 1994-08-09 Henkel Corporation Acidic aluminum cleaner containing an oxidant and a nonionic surfactant stabilized by a glycol
JP2008107706A (ja) * 2006-10-27 2008-05-08 Yamaha Corp 話速変換装置およびプログラム

Also Published As

Publication number Publication date
JP2506730B2 (ja) 1996-06-12

Similar Documents

Publication Publication Date Title
US10347244B2 (en) Dialogue system incorporating unique speech to text conversion method for meaningful dialogue response
JP6665305B2 (ja) 数字音声認識における音声デコーディングネットワークを構築するための方法、装置及び記憶媒体
JP3284832B2 (ja) 音声認識対話処理方法および音声認識対話装置
US5794204A (en) Interactive speech recognition combining speaker-independent and speaker-specific word recognition, and having a response-creation capability
KR0123934B1 (ko) 저렴한 음성 인식 시스템 및 방법
JPH06501319A (ja) 連続スピーチ処理システム
US5734793A (en) System for recognizing spoken sounds from continuous speech and method of using same
US20230070000A1 (en) Speech recognition method and apparatus, device, storage medium, and program product
US7212965B2 (en) Robust parameters for noisy speech recognition
JP3444108B2 (ja) 音声認識装置
Lee et al. Cantonese syllable recognition using neural networks
JPS63223798A (ja) 音声認識方法
TWI297487B (en) A method for speech recognition
JP2705061B2 (ja) 音声認識方法
JP2853418B2 (ja) 音声認識方法
JP4449380B2 (ja) 話者正規化方法及びそれを用いた音声認識装置
JPS6378200A (ja) 音声認識方法
JP2980382B2 (ja) 話者適応音声認識方法および装置
Kuah et al. A neural network-based text independent voice recognition system
JPH0451037B2 (ja)
JPH054680B2 (ja)
JPH01260497A (ja) 音声認識方法
JPH11212587A (ja) 音声認識における雑音適応方法
JP2710045B2 (ja) 音声認識方法
JPH09305195A (ja) 音声認識装置および音声認識方法

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term