JPH05165489A - 音声認識方法 - Google Patents

音声認識方法

Info

Publication number
JPH05165489A
JPH05165489A JP3330274A JP33027491A JPH05165489A JP H05165489 A JPH05165489 A JP H05165489A JP 3330274 A JP3330274 A JP 3330274A JP 33027491 A JP33027491 A JP 33027491A JP H05165489 A JPH05165489 A JP H05165489A
Authority
JP
Japan
Prior art keywords
standard pattern
partial
word
frame
pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3330274A
Other languages
English (en)
Inventor
Tatsuya Kimura
達也 木村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP3330274A priority Critical patent/JPH05165489A/ja
Publication of JPH05165489A publication Critical patent/JPH05165489A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 本発明は、不特定話者を対象とする認識性能
の優れた音声認識方法を提供することを目的とする。 【構成】 本発明は、同一単語の複数個の音声サンプル
を、音響イベントに分割し、同一音響イベント内の部分
区間毎の平均値と共分散を求める事により第1の標準パ
ターンを作る。この標準パターンを学習用の標準パター
ンとして、学習用の各サンプルと標準パターンとの間の
フレーム対応をとり部分ベクトルを再度切出す。切出さ
れた同一クラスに属する部分ベクトルの統計情報を再度
算出する事により第2の標準パターンを作成し、認識用
とする。この認識用の標準パターンを作成する際には、
不特定話者のデータを取扱うのに適した統計的距離尺度
を利用する事が出来るため、多くの学習サンプルについ
て精度の高い音響イベントへの分割が可能となるため質
の良い標準パターンができる。従って、質の良い標準パ
ターンを得る事ができ、認識率の向上を図る事ができ
る。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は人間の声を機械に認識さ
せる音声認識方法に関するものである。
【0002】
【従来の技術】近年、使用者の声を登録することなし
に、誰の声でも認識できる不特定話者用の認識装置が実
用として使われるようになった。不特定話者用の実用的
な認識方法を、特開昭61-188599号公報を第1の従来
例、特開昭62-111293号公報を第2の従来例として説明
する。
【0003】第1の従来例の方法は入力音声の始端、終
端を求めて音声区間を決定し、音声区間を一定時間長
(Iフレーム)に線形伸縮し、これと単語標準パターン
との類似度を統計的距離尺度を用いてパターンマッチン
グをすることによって求め、単語を認識する方法であ
る。
【0004】単語標準パターンは、認識対象単語を多く
の人に発声させて音声サンプルを収集し、すべての音声
サンプルを一定時間長Iフレーム(実施例ではI=1
6)に伸縮し、その後、単語ごとに音声サンプル間の統
計量(平均値ベクトルと共分散行列)を求め、これを加
工することによって作成している。すなわち、すべての
単語標準パターンの時間長は一定(Iフレーム)であ
り、原則として1単語に対し1標準パターンを用意して
いる。
【0005】第1の従来例では、パターンマッチングの
前に音声区間を検出する必要があるが、第2の従来例は
音声区間検出を必要としない部分が異なっている。パタ
ーンマッチングによって、ノイズを含む信号の中から音
声の部分を抽出して認識する方法(ワードスポッティン
グ法)を可能とする方法である。すなわち、音声を含む
十分長い入力区間内において、入力区間内に部分領域を
設定し、部分領域を伸縮しながら標準パターンとのマッ
チングを行なう。そして、部分領域を入力区間内で単位
時間ずつシフトして、また同様に標準パターンとのマッ
チングを行なうという操作を設定した入力区間内全域で
行ない、すべてのマッチング計算において距離が最小と
なった単語標準パターン名を認識結果とする。ワードス
ポッティング法を可能にするために、パターンマッチン
グの距離尺度として事後確率に基づく統計的距離尺度を
用いている。
【0006】
【発明が解決しようとする課題】従来例の方法は、小型
化が可能な実用的な方法であり、特に第2の従来例は、
騒音にも強いことから実用として使われ始めている。し
かし、従来例の問題点は十分な単語認識率が得られない
ことである。このため、語彙の数が少ない用途にならば
使うことが出来るが、語彙の数を増やすと認識率が低下
して実用にならなくなってしまう。従って、従来例の方
法では認識装置の用途が限定されてしまうという課題が
あった。
【0007】即ち、従来例において認識率が十分でない
要因は次の2点である。 (1)認識対象とする全ての単語長(標準パターンの時
間長)を一定の長さIフレームにしている。これは、単
語固有の時間長の情報を欠落させていることになる。
【0008】(2)入力長をIフレームに伸縮するので
欠落したり重複するフレームが生じる。前者は情報の欠
落になり、後者は冗長な計算を行なうことになる。そし
てどちらの場合も認識に重要な「近隣フレーム間の時間
的な動き」の情報が欠落してしまう。
【0009】本発明は上記従来の課題を解決するもの
で、「処理が単純で装置の小型化が可能である」、「方
法が簡単なわりには認識率が高い」、「騒音に対して頑
強である」という従来の長所を生かしながら、従来例よ
りも格段に認識率を向上させる音声認識方法を提供する
ことを目的とするものである。
【0010】
【課題を解決するための手段】本発明は上記目的を達成
するもので、以下の手段によって上記課題を解決した。
【0011】まず課題(1)に対しては、単語ごとに標
準時間長Ik(k=1,2,…K;Kは認識対象単語の種類)を
設定し、単語長情報の欠落がないようにした。Ikは単
語ごとに多くの発声サンプルを集め、その平均値とし
た。
【0012】課題(2)に対しては、情報の欠落がない
ように、常に近隣の複数フレームをひとまとめにしたも
のをパラメータとしてパターンマッチングを行なう。ま
た、近隣フレーム間の時間的な動きが欠落しないように
するために、パターンマッチングに用いる距離尺度には
フレーム間の相関を含む統計的な距離尺度を用いる。
【0013】また、予め多数の人が発声した音声データ
を用いて音声データの一部を表現する部分パターンを音
声全体をカバーできるように複数種類作成し、複数種類
の部分パターンを連接して第1の単語標準パターンを構
成する。その第1の単語標準パターンの一部である部分
パターンと特徴パラメータベクトルの部分パターンとの
部分距離を統計的距離尺度で計算し、入力音声区間の各
フレームと上記第1の単語標準パターンの各フレームの
フレーム対毎に上記部分距離を逐次算出し、この部分距
離を時間の順序関係を保ちながら最適に累積する事によ
り、入力音声と上記第1の単語標準パターンとの距離を
求め、最小距離を得た場合の最適フレーム対の履歴を保
存しておく。この履歴にしたがい、第1の単語標準パタ
ーンのフレームを基準として、入力音声を学習用に用意
されている同一単語の複数サンプルについて分割し、同
一分割位置に対応する特徴パラメータの統計量を求める
事により第2の単語標準パターンを作成する。入力音声
の特徴パラメータベクトルと上記第2の単語標準パター
ンの一部である部分パターンとの部分距離を統計的距離
尺度で計算し、入力音声区間の各フレームと上記第2の
単語標準パターンの各フレームのフレーム対毎に上記部
分距離を逐次算出し、この部分距離を時間の順序関係を
保ちながら最適に累積する事により、入力音声と上記第
2の単語標準パターンとの最小距離を求め、入力音声の
終了時点で全認識対象単語の第2の標準パターンに対す
る距離を相互に比較し、上記距離が最小となる第2の単
語標準パターンに対応する音声名を認識結果とする。
【0014】
【作用】本発明は上記構成によって、不特定話者用の音
声認識に対して高い認識率が得られ、また処理が単純な
ので、信号処理プロセッサ(DSP)を用いて、小型で
リアルタイム動作が可能な認識装置であり、ワードスポ
ッティング機能を導入することによって、騒音に対して
頑強な、実用性の高いものとなっている。
【0015】さらに、上記手段により、第1の単語標準
パターンを用いて、学習用の各サンプルと標準パターン
との間のフレーム対応をとり部分ベクトルを切出し、切
出された同一クラスに属する部分ベクトルの統計情報を
算出して第2の単語標準パターンを作成する。実際の認
識の際にはこの第2の単語標準パターンを利用する。こ
の第2の単語標準パターンを作成する際には、不特定話
者のデータを取扱うのに適した統計的距離尺度を利用す
る事が出来る。従って、多くの学習サンプルについて精
度の高いフレーム対応を取りながら標準パターン作成を
する事が可能となる。そのため、従来法に比して質の良
い標準パターンを得る事ができ、認識率の向上を図る事
ができる。
【0016】
【実施例】図1は本発明の実施例の構成を示したもので
ある。図1において、音響分析部11は入力信号をAD変
換してを一定時間長(フレームと呼ぶ。この例では1フ
レーム=10ms)ごとに分析する。例では線形予測分析
(LPC分析)を用いている。特徴パラメータ抽出部12
では音響分析部11の出力結果に基づき、特徴パラメータ
を抽出する。本実施例では、LPCケプストラム係数
(C0〜C10)および差分パワー値V0の12個のパラメー
タを用いている。入力の1フレームあたりの特徴パラメ
ータを
【0017】
【外1】
【0018】と表すことにすると(数1)のようにな
る。
【0019】
【数1】
【0020】ただし、iは入力のフレーム番号、pはケプ
ストラム係数である(p=10)。
【0021】音声区間検出部13は入力信号音声の始端、
終端を検出する部分である。音声区間の検出法は音声の
パワーを用いる方法が簡単で一般的であるが、どのよう
な方法でもよい。ここでは音声の始端が検出された時点
で、認識が始まりi=1になるとする。複数フレームバッ
ファ14は第iフレームの近隣のフレームの特徴パラメー
タを統合してパターンマッチング(部分マッチング)に
用いる入力ベクトルを形成する部分である。第iフレー
ムにおける入力ベクトル
【0022】
【外2】
【0023】は、(数2)のようになる。
【0024】
【数2】
【0025】(数2)はmフレームおきにi−l1〜i+l2
フレームの特徴パラメータを統合したベクトルであり、
l1=l2=3,m=1 とするとこの次元数は (p+2)*(l1+l2
+1)=12×7=84となる。なお、(数2)ではフレーム
間隔mは一定になっているが、必ずしも一定である必要
はない。mが一定でない場合は非線形にフレームを間引
くことに相当する。本発明では2種類の単語標準パター
ンを用いる。1つは学習用として用いる標準パターンで
あり、学習用標準パターン格納部15に格納されている。
もう1つは認識に用いる標準パターンであり、認識用標
準パターン格納部16に格納されている。「学習」「認
識」の切替えは図1中の切替スイッチSWを用いて行
う。
【0026】[標準パターン作成法]まず学習用標準パ
ターンの作成方法を説明する。話をわかり易くするため
に、今、認識対象単語を日本語の数字「イチ」「ニ」
「サン」「シ」「ゴ」「ロク」「ナナ」「ハチ」「キュ
ウ」「ゼロ」の10種とする。このような例を用いても
説明の一般性にはなんら影響はない。たとえば、「サ
ン」の標準パターンは次のような手段で作成する。
【0027】(1)多数の人(100名とする)がサン
と発声したデータを用意する。このデータを「学習用サ
ンプル」と記す。
【0028】(2)100名のサンの持続時間分布を調
べ、100名の平均時間長JSを求める。
【0029】(3)JSの時間長のサンプルを100名の
中から探し出す。複数のサンプルがあった場合はフレー
ムごとに複数サンプルの平均値を計算する。このように
求められた代表サンプル
【0030】
【外3】
【0031】を(数3)とする。
【0032】
【数3】
【0033】ここで
【0034】
【外4】
【0035】は1フレームあたりのパラメータベクトル
であり、(数1)と同様に11個のLPCケプストラム
係数と差分パワーで構成される。
【0036】(4)100名分の各サンプル
【0037】
【外5】
【0038】と代表サンプル
【0039】
【外6】
【0040】との間でパターンマッチングを行ない、代
表サンプルのフレームと100名分の各サンプルのフレ
ーム間の対応関係を求める(最も類似したフレーム同志
を対応づける)。なお、フレーム間の対応関係は例えば
ダイナミックプログラミングの手法を用いれば効率よく
求めることができる。
【0041】(5)代表サンプルの各フレーム(j=1〜
J3)に対応して、100名分のサンプルそれぞれから
(数2)の形の部分ベクトルを切り出す。簡単のため l
1=l2=3、m=1 とする。
【0042】代表サンプルの第jフレームに相当する、
100名分のデータのうち第n番目のサンプルの部分ベ
クトルを(数4)とする。
【0043】
【数4】
【0044】ここで(j)は同一単語「サン」の第n番目
のサンプル中、代表ベクトルの第jフレームに対応する
フレームであることを示す。本実施例では84次元のベ
クトルである(n=1〜100)。
【0045】(6)100名分の
【0046】
【外7】
【0047】の平均値
【0048】
【外8】
【0049】(84次元)と共分散行列
【0050】
【外9】
【0051】(84×84次元)を求める(j=1〜
J3)。平均値と共分散行列は標準フレーム長の数J3だけ
存在することになる。ただし、これらは必ずしも全フレ
ームに対して作成する必要はなく、間引いて作成しても
よい。
【0052】上記(1)〜(6)同様の手続きで「サ
ン」以外の単語に対しても
【0053】
【外10】
【0054】を求める。全ての単語に対する100名分
すべてのサンプルデータに対し、移動平均
【0055】
【外11】
【0056】(84次元)と移動共分散行列
【0057】
【外12】
【0058】(84×84次元)を求める。これらを周
囲パターンと呼ぶ。
【0059】次に平均値と共分散を用いて学習用標準パ
ターンを作成する。 a.共分散行列を共通化する
【0060】
【数5】
【0061】ここで、Kは認識対象単語の種類(K=1
0)、Jkは単語k(k=1,2,…,K)の平均時間長を表わ
す。また、gは周囲パターンを混入する割合であり通常g
=1 とする。
【0062】b.各単語の部分パターン
【0063】
【外13】
【0064】を作成する。
【0065】
【数6】
【0066】
【数7】
【0067】これらの式の導出は後述する。
【0068】標準パターン作成の概念図は学習用、認識
用とも図2に示す通りである。音声サンプルの始端と終
端の間において、代表サンプルとのフレーム対応を求め
て、それによって音声サンプルをJ3に分割する。図で
は、代表サンプルとの対応フレームを求めて(j)で示
してある。そして、(j)=1〜(j)=J3の各々につい
て、(j)−l1〜(j)+l2の区間の100名分のデータ
を用いて平均値と共分散を計算し、部分パターン
【0069】
【外14】
【0070】を求める。従って、単語kの標準パターン
は互にオーバーラップする区間を含むJk個の部分パター
ンを接続したものになる。周囲パターンは図のようにl1
+l2+1フレームの部分区間を1フレームずつシフトさせ
ながら平均値と共分散を求める。周囲パターン作成の範
囲は音声区間のみならず前後のノイズ区間も対象として
もよい。
【0071】各単語について得られた学習用標準パター
ンは学習用標準パターン格納部15にあらかじめ格納して
おく。
【0072】[部分距離の計算]上記のようにしてあら
かじめ作成されている部分パターンと複数フレームバッ
ファとの間の距離(部分距離)を部分距離計算部17にお
いて計算する。部分距離の計算は(数2)で示す複数フ
レームの情報を含む入力ベクトルと各単語の部分パター
ンとの間で、統計的な距離尺度を用いて計算する。単語
全体としての距離は部分パターンとの部分距離を累積し
て求めることになるので、入力の位置や部分パターンの
違いにかかわらず距離値が相互に比較できる方法で部分
距離を計算する必要がある。このためには、事後確率に
基づく距離尺度を用いる必要がある。(数2)の形の入
力ベクトルを
【0073】
【外15】
【0074】とする(簡単のため当分の間i,jを除いて
記述する)。単語kの部分パターン
【0075】
【外16】
【0076】に対する事後確率
【0077】
【外17】
【0078】はBayesの定理を用いて次のようになる。
【0079】
【数8】
【0080】右辺第1項は、各単語の出現確率を同じと
考え、定数として取扱う。右辺第2項の事前確率は、パ
ラメータの分布を正規分布と考え、(数9)となる。
【0081】
【数9】
【0082】
【外18】
【0083】は単語とその周辺情報も含めて、生起し得
る全ての入力条件に対する確率の和であり、パラメータ
がLPCケプストラム係数やバンドパスフィルタ出力の
場合は、正規分布に近い分布形状になると考えることが
できる。これが正規分布に従うと仮定し、平均値と共分
散行列
【0084】
【外19】
【0085】を用いると、次のようになる。
【0086】
【数10】
【0087】(数9)、(数10)を(数8)に代入
し、対数をとって、定数項を省略し、さらに−2倍する
と、次式を得る。
【0088】
【数11】
【0089】この式は、Bayes距離を事後確率した式で
あり、識別能力は高いが計算量が多いという欠点があ
る。この式を次のようにして線形判別式に展開する。全
ての単語に対する全ての部分パターンそして周囲パター
ンも含めて共分散行列が等しいものと仮定する。このよ
うな仮定のもとに共分散行列を(数5)によって共通化
し、(数11)に代入すると、(数11)の第1項、第
2項は次のように展開できる。
【0090】
【数12】
【0091】(数11)第1式の第3項は0になる。従
って、(数11)は次のように簡単な一次判別式にな
る。
【0092】
【数13】
【0093】ここで、改めて単語kの第j部分パターン
と入力の第iフレーム近隣ベクトルの部分パターンの類
似度として(数13)を書き直すと、
【0094】
【数14】
【0095】ここで、
【0096】
【外20】
【0097】はそれぞれ式(数6)、(数7)で与えら
れる。
【0098】
【外21】
【0099】は単語kの第j部分パターンと入力のiフレ
ーム近隣ベクトルの部分類似度として添え字i,jを用い
て(数13)のLkを改めて書きなおしたものである。
【0100】図1において距離累積部18は、各単語に対
する部分距離j=1〜Jkの区間に対して累積し、単語全体
に対する類似度を求める部分である。その場合入力部分
(Iフレーム)を各単語の標準時間長Jkに伸縮しながら
累積する必要がある。この計算はダイナミックプログラ
ミングの手法(DP法)を用いて効率よく計算できる。
【0101】いま、例えば「サン」の累積距離を求める
ことにすると、常にk=3なのでkを省略して計算式を
説明する。
【0102】入力の第iフレーム部分と第j番目の部分
パターンとの部分距離L(i,j)と表現し、(i,j)フレーム
までの累積距離をg(i,j)と表現することにする。経路判
定部19は
【0103】
【数15】
【0104】の演算を行い、式で示した3つの経路のう
ち累積距離が最小になる経路を選択する。この時に経路
判定部で選択された経路の履歴は経路格納部110に格納
される。
【0105】この経路の履歴を同一単語の全ての学習用
音声サンプル毎に求める。この経路の履歴は学習用音声
データ間について共通の音響イベントに分割している。
認識用標準パターン作成部111は経路の履歴と複数フレ
ームバッファ14に格納されている特徴パラメータ系列を
入力し、学習用の全サンプルについての統計情報即ち、
平均値ベクトルと共分散行列を求める。以下、上述の学
習用標準パターン作成の手続き(4)以降の手続を繰返
す事により、認識用の標準パターンが作成される。出来
上がった認識用標準パターンは認識用標準パターン格納
部16に格納される。
【0106】[認識処理]認識処理は、切替スイッチS
Wを「認識」に切換えて、標準パターン作成と同じ部分
距離の算出を1入力当り、全ての単語標準パターンにつ
いて行う。(数15)に従って逐次部分距離を累積して
ゆき、j=Jk,i=Iとなる時点での累積距離g(i,Jk)を単
語kの類似度とする。判定部112は、累積距離g(i,Jk)の
最小値を与える単語kを求め出力する。
【0107】
【発明の効果】本発明は複数のフレームで形成される入
力ベクトルと、単語音声の部分パターンとの部分距離を
事後確率に基づく統計的距離尺度で求め、フレームをシ
フトしながら入力ベクトルを更新して各部分ベクトルと
の間の距離を累積してゆき、累積距離を最小とする単語
を認識結果とする方法に関するものである。
【0108】本発明は先ず、高い認識率が得られること
が特長である。そして、計算の方法が単純であるので信
号処理プロセッサ(DSP)を用いた小型装置として容
易に実現できる。また、ワードスポッティングを行なう
ことができるので、環境騒音や話者自身が発する「え
〜」,「あ〜」などの不要語が混入した場合でも良好な
認識率が確保できる。
【0109】さらに、実際の認識の際には、第1の単語
標準パターンを用いて精度の高いフレーム対応を取りな
がら作成した第2の単語標準パターンを利用する。この
第2の単語標準パターンの作成の際には、不特定話者の
データを取り扱うのに適した統計的距離尺度を利用する
ことができるので、従来法に比して質の良い標準パター
ンを得ることができ、認識率の向上を図ることができ
る。
【0110】このように本発明は実用上有効であり、そ
の効果は大きい。
【図面の簡単な説明】
【図1】本発明の一実施例における音声認識装置の構成
【図2】同実施例における単語標準パターン作成の概念
【符号の説明】
11 音響分析部 12 特徴パラメータ抽出部 14 複数フレームバッファ 15 学習用標準パターン格納部 16 認識用標準パターン格納部 17 部分距離計算部 18 距離累積部 110 経路格納部 111 認識用標準パターン作成部 112 判定部

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 入力音声信号を分析の基本単位であるフ
    レーム毎に分析し分析パラメータを抽出し、分析フレー
    ムの前後の複数フレームにわたる上記分析パラメータ列
    を統合したベクトルを当該フレームにおける特徴パラメ
    ータベクトルとして得、予め多数の人が発声した音声デ
    ータを用いて音声データの一部を表現する部分パターン
    を音声全体をカバーできるように複数種類作成し、複数
    種類の部分パターンを連接して単語の標準パターンを構
    成するという方法で第1の単語標準パターンを作成し、
    その第1の単語標準パターンの一部である部分パターン
    と上記特徴パラメータベクトルの部分パターンとの部分
    距離を統計的距離尺度で計算し、入力音声区間の各フレ
    ームと上記第1の単語標準パターンの各フレームのフレ
    ーム対毎に上記部分距離を逐次算出し、この部分距離を
    時間の順序関係を保ちながら最適に累積する事により、
    入力音声と上記第1の単語標準パターンとの距離を求
    め、最小距離を得た場合の最適フレーム対の履歴を保存
    しておき、上記履歴にしたがって、第1の単語標準パタ
    ーンのフレームを基準として入力音声を分割し、上記分
    割を、学習用に用意されている同一単語の複数サンプル
    について行い、同一分割位置に対応する特徴パラメータ
    の統計量を求める事により第2の単語標準パターンを作
    成し、入力音声の特徴パラメータベクトルと上記第2の
    単語標準パターンの一部である部分パターンとの部分距
    離を統計的距離尺度で計算し、入力音声区間の各フレー
    ムと上記第2の単語標準パターンの各フレームのフレー
    ム対毎に上記部分距離を逐次算出し、この部分距離を時
    間の順序関係を保ちながら最適に累積する事により、入
    力音声と上記第2の単語標準パターンとの最小距離を求
    め、入力音声の終了時点で全認識対象単語の第2の標準
    パターンに対する距離を相互に比較し、上記距離が最小
    となる第2の単語標準パターンに対応する音声名を認識
    結果とすることを特徴とする音声認識方法。
  2. 【請求項2】 入力ベクトルと部分パターンとの距離を
    計算する統計的距離尺度が、事後確率に基づく距離尺度
    であることを特徴とする請求項1記載の音声認識方法。
  3. 【請求項3】 統計的距離尺度が事後確率に基づく一次
    判別式であることを特徴とする請求項1記載の音声認識
    方法。
JP3330274A 1991-12-13 1991-12-13 音声認識方法 Pending JPH05165489A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3330274A JPH05165489A (ja) 1991-12-13 1991-12-13 音声認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3330274A JPH05165489A (ja) 1991-12-13 1991-12-13 音声認識方法

Publications (1)

Publication Number Publication Date
JPH05165489A true JPH05165489A (ja) 1993-07-02

Family

ID=18230820

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3330274A Pending JPH05165489A (ja) 1991-12-13 1991-12-13 音声認識方法

Country Status (1)

Country Link
JP (1) JPH05165489A (ja)

Similar Documents

Publication Publication Date Title
JP2739950B2 (ja) パターン認識装置
JP2870224B2 (ja) 音声認識方法
JP3298858B2 (ja) 低複雑性スピーチ認識器の区分ベースの類似性方法
EP0831455A2 (en) Clustering-based signal segmentation
CN113939871A (zh) 讲话区间检测装置、讲话区间检测方法及讲话区间检测程序
JP3428058B2 (ja) 音声認識装置
JP2000310993A (ja) 音声検出装置
JP2002366192A (ja) 音声認識方法及び音声認識装置
JP4666129B2 (ja) 発声速度正規化分析を用いた音声認識装置
JP2502880B2 (ja) 音声認識方法
JPH05165489A (ja) 音声認識方法
JPH05150796A (ja) 音声認識装置
JP2853418B2 (ja) 音声認識方法
JP2746803B2 (ja) 音声認識方法
JP2870268B2 (ja) 音声認識装置
JPH0777998A (ja) 連続単語音声認識装置
JP2543584B2 (ja) 音声標準パタン登録方式
JPH1091186A (ja) 音声認識方法
JPH0451037B2 (ja)
JPH054678B2 (ja)
JP2506730B2 (ja) 音声認識方法
JPH0731504B2 (ja) ピツチ抽出装置
JPH05313695A (ja) 音声分析装置
JPH054679B2 (ja)
JPH0554678B2 (ja)