JPH04273298A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPH04273298A
JPH04273298A JP3034239A JP3423991A JPH04273298A JP H04273298 A JPH04273298 A JP H04273298A JP 3034239 A JP3034239 A JP 3034239A JP 3423991 A JP3423991 A JP 3423991A JP H04273298 A JPH04273298 A JP H04273298A
Authority
JP
Japan
Prior art keywords
recognition
speech
energy
buffer
outputs
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3034239A
Other languages
English (en)
Inventor
Akihiro Kimura
晋太 木村
Yasushi Yamazaki
泰 山崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP3034239A priority Critical patent/JPH04273298A/ja
Publication of JPH04273298A publication Critical patent/JPH04273298A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Circuit For Audible Band Transducer (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、音声を入力して認識す
る音声認識装置に係わり、特に雑音環境下で入力される
音声を認識するのに適した音声認識装置に関する。
【0002】
【従来の技術】音声認識の対象は、人間の発声する音声
であり、連続的に生成された音声信号を観測して音素や
音節の離散的な言語記号に変換することを主目的として
いる。文字や画像パターンと比べると、音声パターンは
時間軸に沿った一次元的なものであるが、同一人が1つ
の単語を発声してもどれ1つとして全く同じ長さのもの
はなく、時間的な長さが大きく変化することもある。ま
た離散的な言語記号に変換するとき、発声器官が物理的
な質量をもっており、前後の音韻の特徴が重なり合って
連続的に生成されることがある。このため、観測される
音声パターンでは音韻の切れ目が明確でない上に、ある
音韻を表しているはずの物理的特徴が前後の音韻の環境
によって大きく変化してしまう調音結合とよばれる現象
がある。
【0003】このように音声パターンは、認識を行う上
で特有の困難な性質を有しているが、この音声パターン
に雑音が混入するとさらに困難となる。従来、雑音環境
下での音声認識においては、単一指向性のマイクロホン
を利用することにより、音声信号のSN比を向上させる
試みが行われてきた。図11はこの状態を表すものであ
る。
【0004】
【発明が解決しようとする課題】しかし、単一指向性の
マイクロホンでは、指向性が鋭いため、口をマイクロホ
ンの指向性の範囲に持ってゆく必要があり、この動作を
忠実に行うことは作業中には非常に面倒である。また、
指向性の範囲から口が外れると入力音声信号のSN比が
悪化し、認識性能が著しく悪化する。
【0005】本発明は、上述の問題点に鑑みてなされた
もので、複数方向に指向性を持つマイクロホンシステム
を用いることにより入力音声信号のSN比の良好な音声
認識装置を提供することを目的とする。
【0006】
【課題を解決するための手段】図1は本発明の原理図を
示す。同図においては1は単一指向性のマイクロホンを
複数個互いに異なる方向に配置してなるマイクロホンで
ある。2は音声認識部でそれぞれのマイクロホン1ごと
に設けられ、接続されたマイクロホン1からの入力音声
を認識し、認識カテゴリ、認識距離などの認識結果およ
び音声エネルギを出力する。3は認識結果判定部で各音
声認識部2の出力のうちから最も適切な認識結果を選択
する。
【0007】また、前記各音声認識部2を、前記マイク
ロホン1の出力を格納する各マイクロホン1毎に設けた
音声バッファ5と、この各音声バッファ5の格納データ
を逐次認識処理する共通の共通認識部6と、この共通認
識部6の認識結果を格納する前記各音声バッファ5毎に
これに対応して設けられた結果バッファ7とから構成す
る。
【0008】また、前記音声認識結果選択部3が、対応
する前記音声エネルギが最大の前記音声認識結果を選択
するようにする。
【0009】また、前記音声認識結果選択部3が、前記
音声エネルギの大きい順に所定数のこの音声エネルギに
対応する音声認識結果を選択し、この音声認識結果のう
ち同じものが多い音声認識結果を採用するようにする。
【0010】また、前記音声認識結果選択部3が前記音
声エネルギの大きい順に所定数のこの音声エネルギに対
応する音声認識結果を選択し、この音声認識結果の認識
距離のカテゴリ別平均値を算出し、この平均値の最も小
さいカテゴリを認識結果として採用するようにする。
【0011】また、互いに異なる方向に向いた複数の単
一指向性のマイクロホン1と、このマイクロホン1の出
力を格納する各マイクロホン1毎に設けた音声バッファ
5と、この各音声バッファ5の格納データの音声エネル
ギを計算し、所定の基準で前記音声バッファ5の格納デ
ータを選択するバッファ選択部8と、このバッファ選択
部8で選択したデータを逐次認識する第2音声認識部9
と、この第2音声認識部9の認識結果を前記音声バッフ
ァ5の所定の基準に対応した判定基準で判定する第2認
識結果判定部10とを備えたものである。
【0012】また、前記所定の基準が、前記音声バッフ
ァ5の出力のうち最大エネルギの出力を選択するもので
あり、前記判定基準が前記第2音声認識部9の出力した
結果をそのまま判定結果として出力するようにする。
【0013】また、前記所定の基準が、前記音声バッフ
ァ5の出力のうち最大エネルギから降順にk個の出力を
選択するものであり、前記判定基準が前記第2音声認識
部9の出力した同じカテゴリの認識結果が多いカテゴリ
を選択するようにする。
【0014】また、前記所定の基準が、前記音声バッフ
ァ5の出力のうち最大エネルギから降順にk個の出力を
選択するものであり、前記判定基準が前記第2音声認識
部9の出力した同じカテゴリ毎の認識距離の平均値のう
ち最も小さい平均値のカテゴリを選択するようにする。
【0015】
【作用】上記構成により、マイクロホン1の利用者がマ
イクロホン1に対してどの方向にいても利用者の口はど
れかのマイクロホン1の指向性の範囲に入るようになる
。認識結果判定部3は各マイクロホン1から入力された
音声のうち、最適の認識結果を最終認識結果とするので
、常に口がいずれかのマイクロホン1の指向性の範囲に
入ったSN比の高い音声に対する認識結果が得られ、高
い認識性能を実現できる。
【0016】また、マイクロホン1ごとに設けられた音
声認識部3を、マイクロホン1毎の音声バッファ4と結
果バッファ7とこれらに共通の共通認識部6より構成す
ることにより、構成が簡単となり安価となる。
【0017】また、認識結果判定部3が、音声エネルギ
が最も大きいマイクロホン1からの入力音声による認識
結果を採用することにより、使用者の口が最もよく向い
たマイクロホン1の出力を採用したことになるので認識
精度が向上する。
【0018】また、認識結果判定部3が、複数認識結果
のうち最も多い認識結果を採用することにより認識精度
が向上する。また、認識結果判定部3が、認識距離のカ
テゴリ別平均値のうち最も小さい平均値をもつカテゴリ
を認識結果として採用するので認識誤りの発生する確率
が低くなる。
【0019】また、バッファ選択部8は所定の基準で認
識処理を行うデータの数を絞ってしまうので、第2音声
認識部9の処理量が低減する。第2認識結果判定部10
は所定の基準に対応した判定基準で判定するので、装置
全体として処理作業が合理化される。
【0020】判定基準として最大エネルギの音声の認識
結果を得るもの、最大エネルギから降順にk個の音声デ
ータの認識結果を得、この多数決をとるもの、又は平均
認識距離の最も小さい認識結果をとるものの効果は先に
述べたものと同じである。
【0021】以下、本発明の実施例を図面を参照して説
明する。図2は本発明の第1実施例の構成を示すブロッ
ク図である。同図において1は立体的に放射状にほぼ球
面の全面に配置された複数個の単一指向性マイクロホン
である。2は各マイクロホン1毎に設けられ、接続され
たマイクロホン1からの音声を認識するとともに、その
音声のエネルギを計算し音声認識結果とともに出力する
。3はこれら音声認識部2からの認識結果を判定する認
識結果判定部で最大エネルギ検出部31と認識結果選択
部32とから構成される。最大エネルギ検出部31は複
数の音声認識部2で得られた複数の音声エネルギの内の
最大エネルギを出力した音声認識部2を検出する。認識
結果選択部32は最大エネルギ検出部31が検出した音
声認識部2の認識結果を取り出し出力する。4は表示装
置でこの認識結果選択部32の出力した認識結果を出力
する。
【0022】図3は音声認識部2の詳細構成を示す。2
1は音声分析部であり、マイクロホン1からの電気音声
信号に対して数ミリ秒〜十数ミリ秒毎に周波数分析を行
い、入力音声の時間−周波数(スペクトル)パターンを
作成する。周波数分析の方法としてはフィルタバンクに
よる方法、FFT(高速フーリェ変換)による方法、L
PC(線形予測係数)分析による方法などが知られてい
る。22はテンプレート記憶部であり、単語音声等の各
認識対象毎( 各カテゴリ毎) の音声の時間−周波数
パターンを予め記憶する。この時間−周波数パターンを
テンプレートと呼ぶ。テンプレートは各認識対象ごとに
用意される。一般には、一つのカテゴリに対して複数の
テンプレートを持つことが可能であるが、ここでは、一
つのカテゴリに対して一つのテンプレートを持つものと
する。 23は照合部であり、音声分析部21で得られた入力音
声の時間−周波数パターンとテンプレート記憶部22の
各テンプレートと照合することにより、入力音声と各テ
ンプレート( 各カテゴリ) の認識距離を計算し、認
識結果を出力する。24はソート部であり、認識結果を
認識距離の小さい順に並べ替える。
【0023】次に本実施例の動作を説明する。音声認識
部2は入力音声を認識するが、その認識対象となるカテ
ゴリの具体例を図4に示す。図4は100 個の都市名
を認識する装置とした場合の都市名を表すカテゴリを示
し、この場合カテゴリは都市名そのものを表す。音声認
識装置2は入力音声に対して各カテゴリ毎に、各カテゴ
リと入力音声の認識距離を計算して出力するが、この認
識距離とはそのカテゴリと入力音声の距離を表し、距離
が小さいほど入力音声はそのカテゴリである可能性が高
い。 図5は図4に示した100 都市名を認識した結果の具
体例を示したもので、(a)は図4に示すカテゴリ毎の
認識距離を示し、(b)はこれをソート部24で認識距
離の小さい順に並べ替えた結果を示す。
【0024】次に認識結果判定部3の動作を説明する。 図6は各音声認識部2別の音声エネルギと認識結果の具
体例を表したもので各音声認識装置2での認識結果が一
位から百位まで認識距離の小さい順に並んでいる。最大
エネルギ検出部31は図6の音声エネルギの部分が最大
となっている認識装置の番号を出力する。図6の例では
、n番目の認識装置からの認識結果の音声エネルギが最
も大きいので音声認識装置番号『n』を出力する。認識
結果選択部32は図6のn番目の認識装置からの認識結
果のみを出力する。
【0025】認識装置nの音声エネルギ(35dB)が
最大とすれば認識結果はアキタとなる。もし最大音声エ
ネルギが複数出た場合は認識結果はアイウエオ順の若い
方をとるなど選択の法則を決めておけばよい。
【0026】次に第2実施例を説明する。図7は第2実
施例の構成を示し、図2に示す第1実施例と認識結果判
定部3の構成が異なる外は同じである。認識結果判定部
3は、検出部33と多数決部34とから構成され、検出
部33は各音声認識部2で得られた音声エネルギの内の
エネルギの大きい方からk個を検出し、そのk個の音声
認識部2の認識結果を出力する。多数決部34は検出部
33で選択されたk個の1位の認識結果のうちから最も
多いカテゴリを出力する。図6の場合を例にとるとk=
3とし検出部33は認識装置番号『1』,『3』,『n
』の認識結果を出力し、多数決部34は『アイチ』, 
『アキタ』, 『アキタ』の3つの認識結果の多数決を
とり、最終的な認識結果『アキタ』を出力する。最も多
いカテゴリが同数となった場合には第1実施例と同様な
選択法則を決めておくとよい。
【0027】次に第3実施例を説明する。図8は第3実
施例の構成を示し、図2に示す第1実施例と認識結果判
定部3の構成が異なる外は同じである。認識結果判定部
3は検出部33と平均部35とから構成される。検出部
33はそれぞれの音声認識部2で得られたそれぞれ音声
エネルギの内の大きい方からk個検出し、そのk個の音
声エネルギを出力した音声認識部2の認識結果を出力す
る。平均部35は検出部33で得られた認識結果の認識
距離値のカテゴリ毎の平均を計算する。
【0028】図6に示した例で説明すると、k=3とし
、検出部33は音声認識装置番号『1』,『3』および
『n』の認識結果を出力し、平均部35は、『アイチ』
の平均距離 (35+40+65) /3=46.7『アキタ』の平
均距離 (40+33+25) /3=32.7『アダチ』の平
均距離 (55+65+80) /3=66.7を算出し、最終
的な認識結果として、平均距離の最も小さい『アキタ』
を出力する。
【0029】次に第4実施例を説明する。図9は第4実
施例の構成を示し、図2に示す第1実施例の音声認識部
2の共通化を図っている。音声バッファ5は各マイクロ
ホン1毎に設けられ各マイクロホン1からの音声を記憶
する。共通認識部6は各音声バッファ5に共通に設けら
れ、各音声バッファ5の格納内容を順次認識し、音声認
識結果とその認識距離を求め、これに対応する音声のエ
ネルギを計算する。結果バッファ7は各音声バッファ5
に対応して設けられ各音声バッファ5に格納された音声
データの認識結果およびその音声エネルギを格納する。 本実施例は第1実施例の各音声認識部2の音声認識およ
び音声エネルギ算出機能を共通認識部6で行うようにし
ているため構成が簡易化され安価な音声認識装置を実現
することができる。
【0030】なお、第1〜第3実施例では、図3に示す
テンプレート記憶部22を各音声認識部2が備えると説
明したが、これを共通のテンプレート記憶部22とし、
各音声認識部2の照合部23が使用するようにしてもよ
い。
【0031】次に、第5実施例について説明する。図1
0は第5実施例の構成を示す。本実施例は、音声認識を
行う前に音声認識を行うべき音声バッファ(マイクロホ
ン)を選択することにより音声認識処理量の低減を図っ
ている。マイクロホン1は互いに異なる方向に向いた複
数の単一指向性のマイクロホンからなる。音声バッファ
5は各マイクロホン1毎に設けられ各マイクロホン1か
らの音声データを記憶する。バッファ選択部8は音声バ
ッファ5に記憶された音声データの音声エネルギを計算
し所定の基準で音声バッファを選択する。この基準によ
る選択の方法は、第1実施例で述べた最大エネルギの音
声バッファを選択する方法、第2実施例または第3実施
例で述べた音声エネルギの大きい方から降順にk個選択
する方法などがある。
【0032】第2音声認識部9は選択された音声バッフ
ァの音声データを逐次認識する。第2認識結果判定部1
0では、第2音声認識部9で得られた認識結果を、バッ
ファ選択部8の選択方法に基づて判定する。すなわち、
バッファ選択部8で最大エネルギの音声バッファを選択
する方法を採用した場合は、第2音声認識部9の結果は
一つの音声バッファの音声データのものであるため、第
2音声認識部9の結果をそのまま出力する。また、バッ
ファ選択部8で音声エネルギの大きい方から降順にk個
選択する方法を採用した場合は、第2音声認識部9の結
果は複数の音声バッファの音声データのものであり、第
2実施例で示した認識結果の多数決を取る方法、または
第3実施例で示したカテゴリ毎の平均認識距離が最も小
さいカテゴリを認識結果とする方法を用いる。
【0033】本実施例によれば、選択された音声バッフ
ァのみに対して認識処理を行うため第2音声認識部9の
認識処理量を第1〜4実施例の認識処理量に比べかなり
低減できるため、より安価な認識装置を実現することが
できる。
【0034】
【発明の効果】以上の説明から明らかなように、本発明
は、単一指向性のマイクロホンを複数個互いに異なる方
向に向けて配置して、複数方向に指向性を有するマイク
ロホンシステムを構成しSN比の良好な入力音声信号を
得ることにより、認識性能の高い音声認識装置を実現で
きる。
【図面の簡単な説明】
【図1】本発明の原理図である。
【図2】本発明の第1実施例の構成を示すブロック図で
ある。
【図3】音声認識部の詳細構成図である。
【図4】カテゴリの具体例を説明する図である。
【図5】認識距離の具体例を説明する図である。
【図6】音声エネルギと認識結果の関係の具体例を示す
図である。
【図7】本発明の第2実施例の構成を示すブロック図で
ある。
【図8】本発明の第3実施例の構成を示すブロック図で
ある。
【図9】本発明の第4実施例の構成を示すブロック図で
ある。
【図10】本発明の第5実施例の構成を示すブロック図
である。
【図11】従来例の音声認識装置の構成を示す図である
【符号の説明】
1  マイクロホン 2  音声認識部 3  認識結果判定部 4  表示装置 5  音声バッファ 6  共通認識部 7  結果バッファ 8  バッファ選択部 9  第2音声認識部 10  第2認識結果判定部 21  音声分析部 22  テンプレート記憶部 23  照合部 24  ソート部 31  最大エネルギ検出部 32  認識結果選択部 33  検出部 34  多数決部 35  平均部

Claims (9)

    【特許請求の範囲】
  1. 【請求項1】  互いに異なる方向に向いた複数の単一
    指向性のマイクロホン(1)と、この各マイクロホン(
    1)毎に設けられこのマイクロホン(1)への入力音声
    の音声エネルギとこの音声を認識した認識結果を出力す
    る音声認識部(2)と、この各音声認識部(2)からの
    前記音声エネルギとこの音声エネルギに対応する認識結
    果を入力し、最適の音声認識結果を選択する音声認識結
    果選択部(3)とを備えたことを特徴とする音声認識装
    置。
  2. 【請求項2】  前記各音声認識部(2)を、前記マイ
    クロホン(1)の出力を格納する各マイクロホン(1)
    毎に設けた音声バッファ(5)と、この各音声バッファ
    (5)の格納データを逐次認識処理する共通の共通認識
    部(6)と、この共通認識部(6)の認識結果を格納す
    る前記各音声バッファ(5)毎にこれに対応して設けら
    れた結果バッファ(7)とから構成したことを特徴とす
    る請求項1記載の音声認識装置。
  3. 【請求項3】  前記音声認識結果選択部(3)が、対
    応する前記音声エネルギが最大の前記音声認識結果を選
    択することを特徴とする請求項1または2記載の音声認
    識装置。
  4. 【請求項4】  前記音声認識結果選択部(3)が、前
    記音声エネルギの大きい順に所定数のこの音声エネルギ
    に対応する音声認識結果を選択し、この音声認識結果の
    うち同じものが多い音声認識結果を採用することを特徴
    とする請求項1または2記載の音声認識装置。
  5. 【請求項5】  前記音声認識結果選択部(3)が、前
    記音声エネルギの大きい順に所定数のこの音声エネルギ
    に対応する音声認識結果を選択し、この音声認識結果の
    認識距離のカテゴリ別平均値を算出し、この平均値の最
    も小さいカテゴリを認識結果として採用することを特徴
    とする請求項1または2記載の音声認識装置。
  6. 【請求項6】  互いに異なる方向に向いた複数の単一
    指向性のマイクロホン(1)と、このマイクロホン(1
    )の出力を格納する各マイクロホン(1)毎に設けた音
    声バッファ(5)と、この各音声バッファ(5)の格納
    データの音声エネルギを計算し、所定の基準で前記音声
    バッファ(5)の格納データを選択するバッファ選択部
    (8)と、このバッファ選択部(8)で選択したデータ
    を逐次認識する第2音声認識部(9)と、この第2音声
    認識部(9)の認識結果を前記音声バッファ(5)の所
    定の基準に対応した判定基準で判定する第2認識結果判
    定部(10)とを備えたことを特徴とする音声認識装置
  7. 【請求項7】  前記所定の基準が、前記音声バッファ
    (5)の出力のうち最大エネルギの出力を選択するもの
    であり、前記判定基準が前記第2音声認識部(9)の出
    力した結果をそのまま判定結果として出力することを特
    徴とする請求項6記載の音声認識装置。
  8. 【請求項8】  前記所定の基準が、前記音声バッファ
    (5)の出力のうち最大エネルギから降順にk個の出力
    を選択するものであり、前記判定基準が前記第2音声認
    識部(9)の出力した同じカテゴリの認識結果が多いカ
    テゴリを選択するものであることを特徴とする請求項6
    記載の音声認識装置。
  9. 【請求項9】  前記所定の基準が、前記音声バッファ
    (5)の出力のうち最大エネルギから降順にk個の出力
    を選択するものであり、前記判定基準が前記第2音声認
    識部(9)の出力した同じカテゴリ毎の認識距離の平均
    値のうち最も小さい平均値のカテゴリを選択するもので
    あることを特徴とする請求項6記載の音声認識装置。
JP3034239A 1991-02-28 1991-02-28 音声認識装置 Pending JPH04273298A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3034239A JPH04273298A (ja) 1991-02-28 1991-02-28 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3034239A JPH04273298A (ja) 1991-02-28 1991-02-28 音声認識装置

Publications (1)

Publication Number Publication Date
JPH04273298A true JPH04273298A (ja) 1992-09-29

Family

ID=12408609

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3034239A Pending JPH04273298A (ja) 1991-02-28 1991-02-28 音声認識装置

Country Status (1)

Country Link
JP (1) JPH04273298A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005182140A (ja) * 2003-12-16 2005-07-07 Sony Corp 飲食店の受注装置および受注方法
JP2007295085A (ja) * 2006-04-21 2007-11-08 Kobe Steel Ltd 音源分離装置及び音源分離方法
US7369991B2 (en) 2002-03-04 2008-05-06 Ntt Docomo, Inc. Speech recognition system, speech recognition method, speech synthesis system, speech synthesis method, and program product having increased accuracy
KR100855592B1 (ko) * 2007-01-11 2008-09-01 (주)에이치씨아이랩 발성자 거리 특성에 강인한 음성인식 장치 및 그 방법
JP2016536626A (ja) * 2013-09-27 2016-11-24 アマゾン テクノロジーズ インコーポレイテッド 多方向の復号をする音声認識
WO2020001163A1 (zh) * 2018-06-28 2020-01-02 腾讯科技(深圳)有限公司 语音识别方法和装置、计算机设备和电子设备

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7369991B2 (en) 2002-03-04 2008-05-06 Ntt Docomo, Inc. Speech recognition system, speech recognition method, speech synthesis system, speech synthesis method, and program product having increased accuracy
JP2005182140A (ja) * 2003-12-16 2005-07-07 Sony Corp 飲食店の受注装置および受注方法
JP2007295085A (ja) * 2006-04-21 2007-11-08 Kobe Steel Ltd 音源分離装置及び音源分離方法
KR100855592B1 (ko) * 2007-01-11 2008-09-01 (주)에이치씨아이랩 발성자 거리 특성에 강인한 음성인식 장치 및 그 방법
JP2016536626A (ja) * 2013-09-27 2016-11-24 アマゾン テクノロジーズ インコーポレイテッド 多方向の復号をする音声認識
WO2020001163A1 (zh) * 2018-06-28 2020-01-02 腾讯科技(深圳)有限公司 语音识别方法和装置、计算机设备和电子设备
US11217229B2 (en) 2018-06-28 2022-01-04 Tencent Technology (Shenzhen) Company Ltd Method and apparatus for speech recognition, and electronic device

Similar Documents

Publication Publication Date Title
JP2764277B2 (ja) 音声認識装置
US6278970B1 (en) Speech transformation using log energy and orthogonal matrix
Peacocke et al. An introduction to speech and speaker recognition
US8401861B2 (en) Generating a frequency warping function based on phoneme and context
US5625747A (en) Speaker verification, speech recognition and channel normalization through dynamic time/frequency warping
CN101154380B (zh) 说话人认证的注册及验证的方法和装置
JPH07334184A (ja) 音響カテゴリ平均値計算装置及び適応化装置
Tsenov et al. Speech recognition using neural networks
Kekre et al. Performance comparison of speaker recognition using vector quantization by LBG and KFCG
CN112992109A (zh) 辅助歌唱系统、辅助歌唱方法及其非瞬时计算机可读取记录媒体
US7908142B2 (en) Apparatus and method for identifying prosody and apparatus and method for recognizing speech
JPH02298998A (ja) 音声認識装置とその方法
Grewal et al. Isolated word recognition system for English language
JPH04273298A (ja) 音声認識装置
KR20190135853A (ko) 텍스트- 다중 음성 변환 방법 및 시스템
Gade et al. A comprehensive study on automatic speaker recognition by using deep learning techniques
JP2996019B2 (ja) 音声認識装置
Larcher et al. Constrained temporal structure for text-dependent speaker verification
Tanweer et al. Analysis of combined use of nn and mfcc for speech recognition
JP2000020089A (ja) 音声認識方法及びその装置、並びに音声制御システム
Thakur et al. Design of Hindi key word recognition system for home automation system using MFCC and DTW
JPH04324499A (ja) 音声認識装置
JP2980382B2 (ja) 話者適応音声認識方法および装置
Kuah et al. A neural network-based text independent voice recognition system
KR101752709B1 (ko) 음성인식시스템에서 발화검증 방법 및 그 음성인식시스템

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 19991026